Научная статья на тему 'О двойственной регуляризации в задаче выпуклого программирования в равномерно выпуклом пространстве'

О двойственной регуляризации в задаче выпуклого программирования в равномерно выпуклом пространстве Текст научной статьи по специальности «Математика»

CC BY
167
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЫПУКЛОЕ ПРОГРАММИРОВАНИЕ / СЕКВЕНЦИАЛЬНАЯ ОПТИМИЗАЦИЯ / МИНИМИЗИРУЮЩАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ / РАВНОМЕРНО ВЫПУКЛОЕ ПРОСТРАНСТВО / РЕФЛЕКСИВНОЕ ПРОСТРАНСТВО / ПРИНЦИП ЛАГРАНЖА / ТЕОРЕМА КУНА–ТАККЕРА В НЕДИФФЕРЕНЦИАЛЬНОЙ ФОРМЕ / ДВОЙСТВЕННОСТЬ / РЕГУЛЯРИЗАЦИЯ

Аннотация научной статьи по математике, автор научной работы — Горшков Андрей Александрович

Метод двойственной регуляризации, предложенный ранее для задач выпуклого программирования, множество допустимых элементов в которых, а также образы операторов, задаваемых ограничениями, лежат в гильбертовых пространствах, рассматривается применительно к аналогичным задачам выпуклого программирования, в которых указанные выше гильбертовы пространства заменяются на рефлексивные банаховы, в частности на равномерно выпуклые пространства. Приводится пример задачи оптимального управления для линейного параболического уравнения, показывающий, какой выигрыш в конкретных задачах дает, по сравнению со случаем гильбертова пространства, использование равномерно выпуклого банахова пространства в качестве несущего пространства допустимых элементов оптимизационной задачи.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON DUAL REGULARIZATION IN CONVEX PROGRAMMING IN UNIFORMLY CONVEX SPACE

Uniformly convex reflexive Banach spaces are proposed to be used instead of Hilbert spaces introduced earlier in the dual regularization method for convex programming problems. By an illustrative example of an optimal control problem for a linear parabolic equation, we show a real gain achieved by the use of uniformly convex Banach spaces as spaces of the optimization problem for admissible elements and the operators given by constraints.

Текст научной работы на тему «О двойственной регуляризации в задаче выпуклого программирования в равномерно выпуклом пространстве»

Математика

Вестник Нижегородского университета им. Н.И. Лобачевского, 2013, № 3 (1), с. 172-180

УДК 519.85+517.977

О ДВОЙСТВЕННОЙ РЕГУЛЯРИЗАЦИИ В ЗАДАЧЕ ВЫПУКЛОГО ПРОГРАММИРОВАНИЯ В РАВНОМЕРНО ВЫПУКЛОМ ПРОСТРАНСТВЕ

© 2013 г. А.А. Горшков

Нижегородский госуниверситет им. Н.И. Лобачевского tiger-nn@mail.ru

Поступила в редакцию 04.03.2013

Метод двойственной регуляризации, предложенный ранее для задач выпуклого программирования, множество допустимых элементов в которых, а также образы операторов, задаваемых ограничениями, лежат в гильбертовых пространствах, рассматривается применительно к аналогичным задачам выпуклого программирования, в которых указанные выше гильбертовы пространства заменяются на рефлексивные банаховы, в частности на равномерно выпуклые пространства. Приводится пример задачи оптимального управления для линейного параболического уравнения, показывающий, какой выигрыш в конкретных задачах дает, по сравнению со случаем гильбертова пространства, использование равномерно выпуклого банахова пространства в качестве несущего пространства допустимых элементов оптимизационной задачи.

Ключевые слова: выпуклое программирование, секвенциальная оптимизация, минимизирующая последовательность, равномерно выпуклое пространство, рефлексивное пространство, принцип Лагранжа, теорема Куна-Таккера в недифференциальной форме, двойственность, регуляризация.

Введение

Метод двойственной регуляризации был впервые предложен в работе [1], а затем развит в целом ряде работ (см., например, [2-5]) для задач выпуклого программирования, допустимое множество элементов которых, а также образы операторов, задающих ограничения, лежат в гильбертовых пространствах. Отличительной особенностью этого метода, по сравнению с другими методами регуляризации оптимальных задач (см., например, [6]), является то, что он, помимо того, что представляет собою устойчивый к ошибкам исходных данных алгоритм решения широкого класса оптимизационных задач, позволяет трансформировать классические условия оптимальности в задачах выпуклого программирования в свои соответствующие устойчивые к ошибкам исходных данных секвенциальные аналоги, пригодные для непосредственного практического решения различных прикладных оптимизационных задач [4, 5]. Заметим, что самим классическим условиям оптимальности свойственна, вообще говоря, неустойчивость по отношению к ошибкам исходных данных, благодаря чему, строго говоря, они не могут непосредственно использоваться для решения неустойчивых задач без дополнитель-

ного, порою весьма сложного исследования [4, 5]. Приведем простейший иллюстративный пример двумерной задачи выпуклого программирования, решение в которой неустойчиво по отношению к ошибкам исходных данных, а следовательно, то же самое свойство неустойчивости наследуют в силу выпуклости и регулярности задачи и обычные условия оптимальности для нее в форме классической теоремы Куна-Таккера.

Пример 0.1. Рассмотрим задачу

|х|2 ® шт, Ах £ Ь,х£ D с R2,

- 2 - 1 -1

Л = 0 0 V У , Ь = 0 V У

Эта задача является регулярной, и в ней применима классическая теорема Куна-Таккера. Ее решением является вектор(2/5Д/5) . Обратимся теперь к возмущенной задаче, которая также является регулярной,

|х|2 ® тіп,Л8х £ Ь8,х£ D с R2,

D :{х1 |£ 11 Х2 |£ 1}

- 2 - (-1Ї

, Ь8 ° ю --

со 0

Несмотря на большую популярность и эффективность применения гильбертовых пространств при постановках и решении самых раз-

личных оптимизационных задач, огромное их число очень неудобно, а часто и просто невозможно рассматривать и изучать применительно только к гильбертовым пространствам. Пример такой задачи оптимального управления для параболического уравнения рассмотрен ниже в разделе 3. По этой причине актуальной является задача распространения метода двойственной регуляризации [2-5] на класс задач выпуклого программирования, допустимое множество элементов в которых, а также образы операторов, задающих ограничения, лежат в более общих, по сравнению с гильбертовыми, банаховых пространствах.

В настоящей работе проблема «расширения» метода двойственной регуляризации рассматривается применительно к задачам выпуклого программирования, допустимое множество элементов в которых, а также образы операторов, задающих ограничения, лежат в рефлексивных банаховых пространствах. Ее главной целью является доказательство сходимости метода двойственной регуляризации [2-5] в задаче выпуклого программирования указанного вида, а также иллюстрация его применимости в задаче оптимального управления, естественная постановка которой предполагает использование в качестве пространства допустимых элементов рефлексивного, но не гильбертова, пространства. Отметим при этом, что в качестве такого рефлексивного пространства здесь берется равномерно выпуклое банахово пространство, самым известным конкретным представителем класса которых является пространство измеримых по Лебегу суммируемых с р -й степенью, 1 < Р < + “ , функций.

1. Постановка задачи выпуклого программирования в равномерно выпуклом пространстве

Рассмотрим задачу выпуклого программирования в рефлексивном банаховом пространстве f0(г)® шт,А0г = Ь0,g0(г)£ 0, (1.1)

где г £ D с Z, f0: D ® R1 - липшицевый

строго равномерно выпуклый функционал (определение строго равномерно выпуклого функционала см., например, в [6, 7]),

А0: Z ® В -линейный непрерывный оператор, ga^ : D ® R1,' = 1,...,т,- липшицевы выпуклые функционалы, g°(г) ° (g^Х..^g°т (г)) , Ь0 £ В

- заданный элемент, D - выпуклое замкнутое ограниченное множество, Z, В - рефлексивные пространства. Верхний индекс 0 в исходных данных задачи (1.1) означает, что эти данные

соответствуют ситуации их точного задания. Для определённости будем считать пространство Z равномерно выпуклым. Тогда в соответствии с теоремой 6 в [7] любой функционал вида ЦхЦ1, г £ D, при у > 1 будет заведомо

строго равномерно выпуклым на D .

Пусть решение задачи (1.1) существует. Обозначим это решение (единственное, так как

/•О ^

У - непрерывный строго равномерно выпуклый, аD0 ° {г£ D: А0г = Ь0,g0(z) £ 0,г = 1,...,т} выпуклое замкнутое множество, см. теорему 1 в

[7]) через г0.

Центральным понятием в данной работе является понятие минимизирующего приближенного решения в задаче (1.1) в смысле Дж. Варги

[8]. Введя обозначение

D0Е ° {г £ D :||А0г - Ь°|| £ е, g,0(z) £ е},

при ' = 1,...,т , напомним, что под минимизирующим приближенным решением в задаче (1.1) понимается последовательность х1 £ D, г = 1, 2,..., для которой справедливы следующие соотношения

У) £ ш0 У0(г) + 8', £ Б0Е',

г£ Б

при некоторых последовательностях сходящихся к нулю неотрицательных чисел 8', е',

г = 1,2,...

Так как задача (1.1) является выпуклой, а функционал У0 к тому же строго равномерно выпуклый и непрерывный на Б, то для любого минимизирующего приближенного решения этой задачи г', ' = 1, 2,..., справедливо предельное соотношение

У 0(г') ® У 0(г0),' (1.2)

Более того, можно утверждать, что при сделанных предположениях, в случае разрешимости задачи (1.1) и субдифференцируемости в смысле выпуклого анализа функционала У0, для любого ее минимизирующего приближенного решения справедливо и соотношение г' ® г0,' ® ¥ .

Определим далее наборы невозмущенных

_г0 л 0 7 0 0

У , А , Ь , g и возмущенных исходных данных

У8, А8,Ь8,g8 , 8 £ (0,8 0],8 0 > 0 - некоторое фиксированное число. Будем считать

У8 (г) - У 0(2)\ £ С8 ,|g8 (2) - g °(г)\ £ С8,

||Ь8 - Ь 0|| £ С8, при V г £ Б,

||А8 г - А0х|| £ С8 (1 + Цх]|), при V г £ Z, (1.3) где С > 0 не зависит от 8 и от г £ Б.

С учетом приближенного задания исходных данных мы имеем формально вместо задачи (1.1) семейство задач, зависящих от величины 8 , которая характеризует ошибку задания точных исходных данных,

f0(z)® min,A0z = b0,g0(z)< 0, (1.4)

где z £ D с Z .

Нормы элементов (P, r) и (l, m ) соответственно в пространствах BX Rm и B* X Rm введем следующим образом (см., например, [9, с. 103; 10, с. 47]):

и и /и ик и ик Wk

||(p, r)|| = (||p|| + 1П ) ,p £ B, r £ Rm,

||(i,m )|| = l|i|\k + ||m|\k f*,i £ в* ,m£ Rm,

где 1 < k < ¥ .

Двойственность между B X Rm иB* X Rm

определяется стандартным образом посредством функционала (см., например, [10, с. 48])

((1, m ),(p, r)) = i1, p) + (m, ^,

где (1,m ) £ в* X Rm , (p, r) £ B X Rm.

Введем далее стандартным образом регулярный функционал Лагранжа задачи (1.4):

L (z, 1, m) ° f8 (z) + (1, A8 z - b8) +

+ (m, g8 (z)), z £ d, 1 £ в*, m £ R+m,

а также соответствующий вогнутый двойственный функционал

v8 (1, m) ° inf l8 (z, 1, m), (1, m) £ в* x R+m,

z£ D

и двойственную задачу

v8 (1, m) ® sup, (1, m) £ в* x R+m,

Ввиду строго равномерной выпуклости при любых 1 £ B*, m £ R+m функционала Лагранжа L (z, 1, m), z £ D значение V8 (1, m) достигается на единственном элементе

z8 [1,m ] ° argmin{L8 (z, 1,m ),z£ D}, где (1, m ) £ в* X R+m.

Ниже при формулировании и доказательстве основных результатов нам понадобятся следующие вспомогательные утверждения.

Лемма 1.1. Элемент z8 [1, m ] непрерывно зависит от (1, m ) £ B* X R+m.

Доказательство этого утверждения проводится по аналогии с доказательством утверждения леммы 3.5.1 в [3].

Лемма 1.2. Производная Фреше функционала V8 во внутренней точке (1, m ) множества B* X R+m задается формулой

a Vs (1, m) = (A8 z8 [1, m ] - ь8, g8 (z[1, m ])).

Доказательство этой леммы проводится в точном соответствии с доказательством аналогичной леммы 3.5.2 в [3] в случае гильбертова пространства В. Заметим лишь, что, в отличие от указанного доказательства, при доказательстве сформулированной выше леммы вместо понятия проксимальной нормали к замкнутому множеству гильбертова пространства следует оперировать понятиями так называемых нормалей Фреше (см., например, [11, 12]) к замкнутым множествам в банаховых пространствах и соответствующих им обобщенных субдифференциалов [12].

2. Метод двойственной регуляризации в рефлексивном банаховом пространстве

Рассмотрим функционал

R8■■ (1,т)° V8(1,т)-а||(1,т)||4, (2.1) где (1, т) £ В* х Я?, а > 0, к > 1.

Легко видеть, что функционал Я8 а (1 ,т) является вогнутым, непрерывным и коэрцитивным. При этом о коэрцитивности некоторого функционала F на множестве М в линейном нормированном пространстве V мы говорим,

если, как обычно [13], F(у) = +¥ , при

V £ М . В силу вогнутости, непрерывности и коэр-цитивности Я8 а множество всех точек максимума этого функционала на В х Я? является непустым, ограниченным, выпуклым и замкнутым, а любая максимизирующая последовательность для него на множестве В х Я? сходится к указанному множеству всех точек максимума, которое мы обозначим через М (см., например, [6]). Заметим, что множество М всех точек максимума функционала Я8 а (1, т ), вообще говоря, может состоять и не из одной точки. Далее будем работать с некоторой произвольно выбранной точкой максимума из множества М, обозначаемой через

(18 ,а (8) т 8 ,а (8))

С учётом введенной нормы в пространстве В х Ят выражение (2.1) запишем в виде

я8 •“ (1,т) ° V8 (1,т) - а||1||к - а||т||к, где (1, т) £ В* х Я?, а > 0, к > 1.

Пусть выполняется условие согласования

8

® 0,а (8) ® 0,8® 0. (2.2)

а (8 )

Покажем, что регуляризованные элементы

8^8 ,а (8) .. 8 ,а (8 )п ? . г\

х [1 , т ] сходятся при 8 ® 0 к решению

х 0 невозмущенной задачи (1.1).

Записывая классические условия экстремума (см., например, теорему Куна-Таккера в субдиф-ференциальной форме в [14, с. 262]) для точки

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

/л 8 ,a (8) . .8 ,a (8) ч i /■>

(1 , m ) с учетом леммы 1.2 и предложения

10 в [15, гл. 4, §3] имеем неравенство

( (1 ,m)- (1м(8),mM(8)), (2.3)

|A8z8[18,a(8),m8■■(8)]- b8-ak1'||18■■(8^k-\ g8(z8[18,a(8),m8,a(8)])- a£m'||mM(81k-'))< 0

для любых (1,m ) £ B* X R+m, 1' £ B,m ' £ Rm - такие элементы, для которых выполняются соотношения

(x8 ,a (8), r) = ||18 ,a (8 )||, ||r|| = 1 и (m8 ,a (8), m') = ||m8 ,a (8 )||,

Ilm1l= 1.

Из неравенства (2.3) непосредственно вытекают соотношения:

A8z8[18,a(8),m8,a(8)]- b8 - (2.4)

- a кГ|18,a (8^k-1 = 0,

^ m - m8,a(8),g8(z8[18,a(8),m8,a(8)])- (2.5) - akm'||m8,a(8^|k-^< 0,vm £ R+m.

Из (2.5) следует, что если m j’”(8) > 0 для некоторого j£ {1,. .,m}, то

g8 (z8[18,a(8),m8,a(8)])- akm'||m8,a(8)||k-1 = 0, m j’“(8}gj(z8[18,a(8),m8,a(8)])> 0. (2.6)

-1—1 .. 8 ,a (8) гч

Если же m j = 0 для некоторого

j £ {1,..., m}, то из (2.5) следует, что

g8 (z8 [18,a(8),m8,a(8)]) < 0.

Отсюда и из (2.4) получаем неравенство

^(18 ,a (8), m8 ,a (8)), (2.7)

( a8 z8 [18 ,a (8), m8 ,a (8)] - ь8, g8(z8[18,a(8),m8,a(8)])J> 0.

Заметим, что элементы A8 z8 [18 ,a (8), m8 ,a (8)] -

- b8 и g8 (z8 [18,a(8),m8,a(8)]) ограничены в силу ограниченности D.

Из оценок (2.4), (2.6) и того факта, что

1'||= 1 и ||m '|| = 1, заключаем, что

a (8 )| 18 ,a (8)||k-1 < С, (2.8)

a (8 )||m8 ,a (8 ^k-1 < С, С = const.

Далее можно утверждать, что справедливо предельное соотношение

lim V°(іо,a(о),,a(о)) = sup v°(і,m ). (2.9)

о® + о (і ,m )е b* х R*n

Для его доказательства достаточно практически дословно повторить рассуждения доказательства аналогичного предельного соотношения в [3, с. 259-261] в случае гильбертова пространства B.

В силу (2.9), непрерывности функционала значений V0 и вариационного принципа Эк-ланда (см. [16]) для каждого а е (0,а 0] найдется пара (і'а,m'a)е B* х Rn, удовлетворяющая неравенствам

Цім(о) -і' a||+ ||то ,a (о) - m' ^ e (a), (2.10)

V0(і°,a(о),mо,a(о))> V0(і'a,m'a) и являющаяся решением задачи

- V0(!,m) + e (a )||іо,a(о) - !'a| +

+ |m°,a(о) - m'a||)® min, (і,m)е в* х Rtn,

где e (a ) ® 0, a ® 0. Тогда можно утверждать, что справедливы соотношения соответствующего принципа Лагранжа (см., например, [14, §3.3.1])

A0z8[і' a,m'a]- b0 + e(a)V = 0, |||= 1, - g0(z8 [і' a,m'a ]) + e(a)e - (X„...,Xn) = 0,

где ||Є||< 1, X і mi ” = 0, X і > 0, величины X і,

i = 1,..., n, являются множителями Лагранжа.

Отсюда в силу глобальной липшицевости градиента З V0(!,m ), условия близости (2.10) и сходимости e (a) ® 0, а ® 0 получим, что

A0zо [іо,a(о),m8,а(о)]- b0 ® 0, (2.11)

g0(z8[іо,а(о\m°,а(о)])й f (о), о ® о.

Рассмотрим цепочку неравенств, следующих из (2.11) и (1.3):

||a0z8 [іо,a(о),m8,a(о)]- b°|| + 2со > > ||a0z8[іо,a(о),m8,a(о)]- b0|| + + ||as z8 [іо ,a (о), mо ,a (о)] -- aV[іо,a(о),m8,a(о)] + ||b0- b ||>

> ||asz8 [іо,a(о),m8,a(о)]- b8||® о, о ® o, f (о)> g0(z8[іо,a(о),m8,a(о)]) + со >

> g0(zо[іо,a(о),m8,a(о)])+ + g8 (z8 [іо ,a (о), m8 ,a (о)]) -

- g0(z8[іо,a(о),mо,a(о)])>

> g8(z8[іо,a(о),m8,a(о)]), f (о)® o,о ® o,

откуда, в свою очередь, с учетом (2.8), (2.4)-(2.6) следует, что

а (8)|Х8,а(8)||к-1 ® 0, (2.12)

а (8)|т8,а(8)||к-1 ® 0, 8 ® 0.

Покажем, что из соотношений (2.11) и (2.12) при 8 ® 0 следует

У0(28[18,а(8),т8,а(8)])® у0(20). (2.13)

т ~8 г-} 8 ,а (8) . .8 ,а (8) т

Так как элемент г [1 ,т ] доставляет

минимальное значение функционалу Лагранжа

I8 (г, 18 ,а (8), т8 ,а (8)), г £ Б, то

У8 (г)- У8 (г8 [18,а(8),т8,а(8)]) + + (18,а(8), А8г - А8г8 [18,а(8),т8,а(8}]) + + (т8 ,а (8), g8 (г8 [18 ,а (8), т8 ,а (8 >])) > 0 V г £ Б,

откуда в силу неравенства (2.7) выводим следующее неравенство

У8 (г)- У8 (г8 [18,а(8),т8,а(8)]) + (2.14)

+ (18 ,а (8), А8 г - Ь 8) + (т8 ,а (8), g8 (г)) > 0,

для V г £ Б, или

У8 (г0) - У8 (г8 [1м (8), т8 ,а (8)]) +

+ (18,а(8), А8г0 - Ь8)+ (т8,а(8),g8 (г0)) > 0.

Из последнего неравенства в силу оценок (1.3), условия согласования (2.2), предельных соотношений (2.12), а также положив к > 2 получаем

У8 (х8 [18,а(8\т8,а(8)]) £ У0(г0) + (2.15)

+ С8(1 +1|18,а(8}\\ + ||т8,а(8^|)° Г(х0) + у (8), где У (8) > 0, у (8) ® 0, 8 ® 0.

Далее из (2.15) и (1.3) выводим У\х8[18,а(8),т8,а(8)])° У0(х0) + у 1(8), (2.16) где у ,(8) > 0, у 1(8) ® 0, 8 ® 0.

В силу оценки (2.16) для любой последовательности 8 5, 5 = 1,2,..., 8 5 ® 0, 5 ® ¥ , получаем соотношения

У 0 (х 8 5 [18 5 ,а (8 5 ) т8 5 ,а (8 5 )]) £ У 0 (х 0) +

+ У 1(8 5 ), У 1(8 5 ) ® 0, 8 5 ® 0,

||А0 х8 5 [18 5 ,а (8 5 ), т8 5 ,а (8 5 )] - Ь £ ф (8 5 ) ® 0,

g0(2 8 5 [18 5 ,а (8 5 ), т8 5 ,а (8 5 )]) £ ф (8 5 ) ® 0,

при 8 5 ® 0,' = 1,...,т.

Из этих соотношений следует, что любая последовательность х8 5 [18 5 ,а (8 5), т8 5 ,а (8 5)], 5 = 1, 2,..., является минимизирующим приближенным решением в задаче (1.1) и, значит, в силу предельного соотношения (1.2) мы имеем

У0(х 8 5 [18 5 ,а (8 5 ), т8 5 ,а (8 5 )]) ® У0(х 0), 8 5 ® 0.

Откуда ввиду произвольности выбора последовательности 8 5 мы и получаем, наконец, предельное соотношение (2.13).

Покажем, что одновременно с предельным соотношением (2.13) справедлива и слабая сходимость

х8 [18 ,а (8), т8 ,а (8)] ® х0 слабо в Z, (2.17)

при 8 ® 0. Перепишем для этого неравенство (2.14) в виде

У 0( х8 [18 ,а (8), т8 ,а (8)]) £

£ (У8(х8[18,а(8),т8,а(8)])-

- У8(х8[18,а(8),т8,а(8)]))+ У8(х) +

+ (18,а(8),А8х- Ь8) + (т8,а(8),g8 (х)) Vх£ Б.

Подставляя в это неравенство произвольный элемент х из множества Б0 ° {х £ Б:

А0х = Ь0,g0(х) £ 0}, получаем в силу (1.3)

У0(х8 [18,а(8),т8,а(8)]) £ С8 + (2.18)

+ У8 (х) + (х8,а(8),А0х - Ь0) + С81|18,а(8}\\ + + (т8,а (8;, g0(х)) + С8 ||т8 ,а (8^ £ С8 +

+ У0 (х) + С8 (1 + |1М (8 }\\ + ||т8 ,а (8 }\\).

В силу предельного соотношения (2.13) не ограничивая общности считаем, что

х8[18,а(8),т8,а(8)]® х*слабо в Z, (2.19)

при 8 ® 0, х* £ Б. Тогда, пользуясь непрерывностью снизу строго равномерно выпуклого функционала У0 и условием согласования (2.2), выводим из (2.18), что У0(х*) £ У0(х) V х £ Б0. Так как в то же время, благодаря соотношениям (2.11), полунепрерывности снизу непрерывного выпуклого функционала в равномерно выпуклом пространстве и слабой сходимости (2.19),

*0

можем записать, что х £ Б , то в силу

единственности решения исходной задачи полу-

*0

чаем х = х , т.е. предельное соотношение (2.17) действительно справедливо.

Предположим теперь, что строго равномерно выпуклый функционал У0 является дифференцируемым в смысле Фреше в точках Б. Тогда пользуясь [15] (гл. 4, §3, предложение 3) и определением строго равномерно выпуклой функции можем записать при всех а £ (0,1)

(ЗУ0(х0), а (х8 [18,а(8), т8,а(8)]- х0)) +

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ У0(х0)£ У0(ах8[18,а(8),т8,а(8)] +

+ (1 - а) х0) £ а У 0( х8 [18 ,а (8), т8 ,а (8)]) +

+ (1 -а )У 0(х0) -

- а (1 -а )8 (|| х8 [18 ,а (8), т8 ,а (8)] - х 0||)

или

(1 -а)8(||х8[18,а(8),т8,а(8)]- х0!^

+ (ЗУ0(х0),х8 [18,а(8),т8,а(8)] - х0) £

£ У0(х8[18,а(8),т8,а(8)])- У0(х0).

Отсюда при а ® + 0 получаем

Г(х8[18,а(8),т8,а(8Ч)- Г(х0)-

- (зу0(х0),х8[18,а(8),т8,а(8)]- х°)>

> 8(||х8[18,а(8),т8,а(8)]- х0||).

Далее из (2.13) и (2.17) имеем

8(| х8 [18 ,а (8), т8 ,а (8)] - х °||)® 0, (2.20)

при 8 ® 0.

Проведя рассуждения, как в [6] (гл. 4, §7, лемма 2), выясняем, что модуль выпуклости 8(t), t£ [0,diaшD] строго равномерно выпуклого функционала У0 можно без ограничения общности считать непрерывным в окрестности нуля и монотонно возрастающим при t > 0, а значит, можем заключить, что t ® 0 при 8(t)® 0, и, следовательно, из (2.20) получаем сильную сходимость по аргументу

\\х8[18,а(8),т8,а(8)]- х0||® 0, 8 ® 0.

Теорема 2.1 [Сходимость алгоритма двойственной регуляризации] Вне зависимости от того, разрешима или нет двойственная к (1.1) задача, при выполнении условия согласования 8/а (8) ® 0, а (8) ® 0, 8 ® 0 выполняются соотношения

У8 (х8 [18,а(8),т8,а(8)]) ® У0(х0), g0(х8 [18,а(8),т8,а(8)]) £ ф (8) ® 0, г = 1,...,т, ||А0х8 [18,а(8\т8,а(8)] - Ь°|| ® 0, 8 ® 0.

Если же строго равномерно выпуклый функционал У0 является и субдифференцируемым в точках Б, то справедливо и предельное соотношение

\\х8[18,а(8),т8,а(8)]- х0||® 0, 8 ® 0.

3. Приложения двойственной регуляризации для задач выпуклого программирования

в равномерно выпуклых пространствах

Основной целью данного раздела является иллюстрация того, какой выигрыш в конкретных задачах дает, по сравнению со случаем гильбертова пространства, использование равномерно выпуклого банахова пространства в качестве несущего пространства допустимых эле-

ментов исходной оптимизационной задачи. Рассмотрим выпуклую задачу оптимального управления с функциональными ограничениями для линейного параболического уравнения в некотором дискретном наборе точек, возможно и граничных, области изменения независимых переменных начально-краевой задачи. Последнее обстоятельство требует погружения множества допустимых элементов в рефлексивное, а именно в равномерно выпуклое банахово пространство суммируемых с р-й степенью, 1 < Р < + м , функций.

Пусть и с Я1 - выпуклый компакт, QT = °йх (0,Т), 5 °ЗП , ST ° {(х, t): х £ S, t £ (0,Т)}, П - ограниченная область в Яп, п > 2, Б =

° {и £ 1р (QT): и (х, 0 £ и п.в. на QT}, Б с с 1р (QT) ° Z, р > п/2 + 1. Для обозначения элементов пространства Z используем традиционную для оптимального управления букву и. Одновременно определим и гильбертово пространство 12^1,) ° Н, норму в котором обозначим через ||'||Н.

Рассмотрим задачу оптимального управления или, другими словами, задачу условной минимизации строго равномерно выпуклого функционала

(Рос) У (и) ® шт, gl(u) = 0, g2(u) £ 0, где и £ Б с Z с Н. Обозначим решение задачи (РоС) через и0, которое предполагаем существующим.

Строго равномерно выпуклый функционал У : Б ® Я1 и векторные функционалы g1 : Б ® Я1, g2: Б ® Ят задаются равенствами

У (и) ° (А0Д(,0х[и](,0, хМО,))^) +

+ (А.,2 0 х[и ](■, T ))

+ (А),3 0,' ) х[и ](■,■), хИО,))^) +

+ |Н1 Р,Qт, у >1 gl(u) ° А1 ^ [u],

g2(и) ° (А1(2,[и],...,Ът(х9[и])),

^[и] °(2[u](x1,t1),...,х[и](хч,tq))*,

(х,ti)£ ,,' = 1,...,q,,£ (0,T),

где х[и] - решение класса V21,0(QT) п С(QT)

третьей начально-краевой задачи для параболического уравнения дивергентного вида

х - (x, 1:) хх,)+ a(x, 1:) х + (3.1)

З х,

+ и(х,t) = 0, х(х,0) = v0(x), х£ П ,

З z

— + о (x,t)z = Wo(x,t), (x,t)е St.

оО

a - a 11

В (3.1),

как

[17],

З z( x, t) З N

о О (О)

II Q £ 8, vo - vo d

llp,QT I Ш

..oil / г IL о „oil

^ A0 11 й о lA8 - A0 l(0) - 0 , 0,2 0,2

A5 - A0 I

^0,1 A0,1

Ab - A

A0,3 A0,3

qt ' ’

О II / s І лі л0|

° ai j(x,t)zxj (x, t)cosai(x, t), at (x, t) - угол, образованный внешней нормалью к S с осью xi.

Ниже будут нужны следующие условия на исходные данные оптимизационной задачи (Poc ):

а) A01 : QT ® R1, A0,2 : W ® R1, A0 3 : ST ® R1

являются измеримыми по Лебегу функциями и выполняются оценки

0 < A01(x, t) < L при п.в. (x,t) £ QT,

0 < A0,2(x) < L при п.в. x£ W ,

0 < A03(x, t) < L при п.в. (x, t) £ ST, где L - некоторая положительная постоянная;

б) функции a, j, a: W X [0,T] ® R1, ^, j =

= 1,2,..., n, измеримы в смысле Лебега, v0 £ C(W ), w0 £ Lr (ST), r > n + 1, Aj - заданная (lX q) -матрица, ht: Rq ® R1, i = 1,...,m, - заданные выпуклые конечные функции;

в) справедливы неравенства

11х Г < ai,j(x, t)x ix j < mlx Г v (x, t) £ qt ,

где 1 > °m > 0 - некоторые постоянные;

г) справедливы включения и оценки

a £ Lp (Qt ), 0 £ Lr (St ),

a(x, t) > C0 п.в. на QT,

0 (x, t) > C0 п.в. на ST,

где p > n/ 2 + 1, r > n = 1.

д) граница S является липшицевой.

Пусть F - множество всевозможных набо-

ров исходных данных {А0,г, ' = 1, 2, 3, А1, Ь,,, =

= 1,..., т, а, v0, и0, о}, для каждого из которых выполняются условия а) - д) с не зависящими от набора постоянными I, С0. Определим набо-

08 ры невозмущенных у и возмущенных у исходных данных, соответственно: У0 = {А00г.,

' = 1, 2,3,А10, Ь°,, = 1,..., т, а0,VЛ, и00,о 0} и у8 ° Ф0,,' = 1, 2, 3, А18, , = 1,...,т, а8, v0, И,о8},

8 £ (0,8 0], 8 0 > 0 - некоторое число. Будем считать, что выполняются следующие оценки

й о , (3.2)

Обозначим задачу (Рос), функционал /, векторные функционалы g1, g 2, элемент Ь, решение х[и] и т.п., соответствующие набору исходных данных /8, 8є [0,8 0], через (Р0с), /8, gl, g2, Ь8, N8 [и], соответственно.

Прежде всего, заметим, что из условий а) -д) (на самом деле их можно ослабить) и теорем существования слабого (обобщенного) решения третьей краевой задачи для линейного параболического уравнения дивергентного вида, которые могут быть найдены в [17, гл. 3, §5], а также в [18], следует разрешимость начально-краевой задачи (3.1) в классе V21,0(QT). Соответствующее утверждение сформулируем в виде следующего предложения.

Утверждение 3.1. Для любого и £ L2(QT) при любом Т > 0 и любом наборе исходных данных /£ F исходная (прямая) задача (3.1) однозначно разрешима в V2,0(QT) и справедлива априорная оценка

N [и\т + Ии]іи£ (3.3)

£ СТ (|М|2,Qт + Ы2,П + 1ЫЦ ),

в которой постоянная СТ не зависит от набора исходных данных / и управляющего параметра и £ L2 ^Т) ° Н.

Одновременно отметим, что для полной определенности постановки задачи (Р0С) сформулированного выше утверждения недостаточно, так как оно, вообще говоря, не гарантирует необходимого включения х\и] £ С(QT).

Однако из условий а) - д) и теорем существования слабого решения третьей краевой задачи для линейного параболического уравнения дивергентного вида [19] следует одновременно и нужная разрешимость начально-краевой задачи (3.1) в классе V2’0(QT)п С(QT). Можно утверждать, что справедливо следующее аналогичное предложению 3.1

Утверждение 3.2. Для любого и £ Ьр (QT) при любом T > 0 и любом наборе исходных данных / £ F задачи (3.1) однозначно разрешима в У1,0^) п С(QT) и при р > п/2 + 1, г > п + 1 справедлива априорная оценка

1,01 + Ы,.,). (3.4)

И< - с

TM + v0,-ПІІ IIp,Qt I 0 Id

\bj (z) - bj (z) й о, j = 1,...,n,

r ,S

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

r ,S

T

и

в

в которой постоянная Ст не зависит от набора исходных данных У и управляющего параметра и £ 1Р ^° Z.

В силу априорной оценки (3.4) при любом наборе исходных данных У значения непрерывного функционала У: Б ® Я1 и непрерывных векторных функционалов g1, g2 : Б ® Я определены на каждом элементе и £ Б. Более того, по указанной причине все эти функционалы определены и непрерывны на всем равномерно выпуклом пространстве 1р (QT) ° Z . Одновременно функционал У: Б ® Я1 является строго равномерно выпуклым и его модуль выпуклости благодаря условиям на исходные данные не зависит от набора У.

Сведем задачу (РОС) настоящего раздела к задаче выпуклого программирования раздела 1. Для этого обозначим через х0 [и] решение возмущенной начально-краевой задачи (3.1) при v0 = 0, и0 = 0. Тогда имеем очевидное равенство х8 [и] = х0 [и] + х8 [0], 8£ [0,8 0]. Задача (Р^) может быть переписана в эквивалентной форме задачи выпуклого программирования раздела 1

(рОс) /8 (и) ® ~1(и) = Ь > ~2(и) £ 0,где и £

£ Б с Z, с линейным непрерывным оператором ~18 : Z ® Я1, задаваемым равенством ~18 (и) °

° А1820,q[и] х0Л[и] ° (х0 [и](х1,/1),..., х0 МСх,,гч))*, и с Ь = - А1 хц [0],8£ [0,8 0]. Липшицевость функционалов У, g1, g2 является следствием априорной оценки утверждения 3.2 и свойств функций Ъ,,, = 1,..., т (см. следствие 2.2 в [20]).

Оценки (3.2) отклонения возмущенных исходных данных от точных в исходной задаче (РОС) в совокупности с априорной оценкой утверждения 3.2 приводят к оценкам отклонения исходных данных возмущенной задачи выпуклого программирования (РОС) от исходных данных соответствующей невозмущенной задачи (РО0С)

У8 (и) - У0(и)| £ С8, (3.5)

^ 2 (и) - g 2°(и)| £ С8 V и £ Б, ||Ь8 - Ь °|| £ С8, ||~18 (и) - ~10|| £ С8 (1 + ||и||) V и £ Z,

с не зависящей от 8 £ [0, 8 0 ] постоянной С > 0. Таким образом, метод двойственной регуляризации, сходимость которого доказана и сформулирована в виде теоремы 2.1 в предыдущем разделе, применим для решения задачи оптималь-

ного управления (РОС) и, как следствие, для решения частного случая этой задачи при У0(х) ° \\х\\1 (А0,г = 0, ' = 1,2,3) g2 (и) ° 0, при-

нимающей в этом случае вид обратной задачи дискретного граничного наблюдения для параболического уравнения. Заметим одновременно, что в рассматриваемой задаче оптимального управления соответствующий элемент

/'18 ,а (8). .8 ,а (8 ) ч г)^wг)m ^

(1 , т ) £ Я х Я+ , доставляющий макси-

мум в регулярной двойственной задаче, определяется единственным образом (за счет равномерной выпуклости исходного пространства допустимых управлений).

Итак, в данном разделе мы рассмотрели задачу оптимального управления (РОС) в равномерно выпуклом пространстве 1Р (й-) = Z, что автоматически обеспечивает при некоторых дополнительных естественных условиях на ее исходные данные, а именно при дифференцируемых функциях , 7 = Х..^ m, и дифференцируемость в смысле Фреше по и в пространстве Z как функционалов g1), g0 : Б ® Я1, так и всего функционала Лагранжа задачи (РОС) в целом. Последнее обстоятельство представляется весьма важным с точки зрения организации реального вычислительного процесса по решению задачи (РОС) и, в частности, процесса решения задачи минимизации функционала Лагранжа, являющегося базовым численным процессом при решении задачи (РОС), например, на основе теоремы 2.1. В настоящей работе, ввиду ограниченности ее объема, мы не приводим формулы для производных Фреше указанных выше функционалов.

Отметим при этом, что формально мы могли бы рассмотреть задачу (РОС) и в гильбертовом пространстве 12 (QT) ° Н. Однако в этом случае непрерывные векторные функционалы gl : Б ® Я, g2 : Б ® Я1, вообще говоря, не являются непрерывными на всем гильбертовом пространстве Н , так как они не определены, вообще говоря, для элементов и £ Н\1р (QT). Одновременно, так как эти функционалы, строго говоря, не определены для указанных элементов, то они заведомо не являются дифференцируемыми в гильбертовом пространстве Н . Изучению такой задачи (без ограничений- неравенств) с точки зрения применимости для ее решения алгоритма двойственной регуляризации была посвящена работа [21], в которой было показано, как может быть применен принцип мак-

симума Понтрягина для нахождения точек минимума недифференцируемого функционала Лагранжа исходной задачи, т.е. для решения базовой задачи этого алгоритма.

В заключение настоящей работы выражаю благодарность своему научному руководителю профессору М.И. Сумину за постановку задачи и внимание к работе.

Работа подготовлена при финансовой поддержке РФФИ (код проекта 12-01-00199-а), а также Минобрнауки РФ в рамках государственного задания на оказание услуг в 2012-2014 гг. подведомственными высшими учебными заведениями (шифр заявки 1.1907.2011).

Список литературы

1. Сумин М.И. Оптимальное управление параболическими уравнениями: двойственные численные методы, регуляризация // Распределенные системы: оптимизация и приложения в экономике и науках об окружающей среде. Сб. докладов к Международной конференции (Екатеринбург, 30 мая - 2 июня 2000 г.). Екатеринбург: Изд-во Ин-та математики и механики УрО РАН, 2000. С. 66-69.

2. Сумин М.И. Регуляризация в линейно выпуклой задаче математического программирования на основе теории двойственности // Журн. вычисл. ма-тем. и матем. физ. 2007. Т. 47. № 4. С. 602-625.

3. Сумин М.И. Некорректные задачи и методы их решения. Материалы к лекциям для студентов старших курсов. Н.Новгород: Издательство ННГУ, 2009.

4. Сумин М.И. Регуляризованная параметрическая теорема Куна-Таккера в гильбертовом пространстве // Журн. вычисл. матем. и матем. физ.

2011. Т. 51. № 9. С. 1594-1615.

5. Sumin M.I. On the Stable Sequential Kuhn-Tuck-er Theorem and its Applications // Applied Mathematics.

2012. V. 3. № 10A (Special issue «Optimization»). P. 1334-1350.

6. Васильев Ф.П. Методы оптимизации. М.: Факториал Пресс, 2002.

7. Владимиров А.А., Нестеров Ю.Е., Чеканов Ю.Н. О равномерно выпуклых функционалах // Вестник Московск. ун-та. Сер. Вычислит. матем. и ки-берн. 1978. № 3. С. 12-23.

8. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977.

9. Данфорд Н., Шварц Дж. Линейные операторы. Т.1: Общая теория. М.: И.Л., 1962.

10. Функциональный анализ (сер. «Справочная математическая библиотека») / Под ред. С.Г. Крейна. М.: Наука, 1972.

11. Borwein J.M., Strojwas H.M. Proximal Analysis and Boundaries of Closed Sets in Banach Space. Part I: Theory // Can. J. Math. 1986. V.38. № 2. P.431-452; Part II: Applications // Can. J. Math. 1987. V. 39. № 2. P. 428-472.

12. Mordukhovich B.S. Variational Analysis and Generalized Differentiation, I: Basic Theory. Berlin: Springer, 2006.

13. Экланд И., Темам Р. Выпуклый анализ и вариационные проблемы. М.: Мир, 1979.

14. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М.: Наука, 1979.

15. Обен Ж.-П., Экланд И. Прикладной нелинейный анализ. M.: Мир, 1988.

16. Ekeland I. On the Variational Principle // J. Math. Anal. Appl. 1974. V.47. №2. P. 324-353.

17. Ладыженская О.А., Солонников В.А., Ураль-цева Н.Н. Линейные и квазилинейные уравнения параболического типа. М.: Наука, 1967.

18. Плотников В.И. Теоремы единственности, существования и априорные свойства обобщенных решений // Докл. АН СССР. 1965. Т. 165. № 1. С. 33-35.

19. Casas E., Raymond J.-P., Zidani H. Pontryagin's Principle for Local Solutions of Control Problems with Mixed Control-State Constraints // SIAM J. Control Op-tim. 2000. Vol. 39. № 4. P. 1182-1203.

20. Обен Ж.-П. Нелинейный анализ и его экономические приложения. М.: Мир, 1988.

21. Сумин М.И. Двойственная регуляризация и

принцип максимума Понтрягина в задаче оптимального граничного управления для параболического уравнения с недифференцируемыми

функционалами // Тр. Ин-та математики и механики УрО РАН. 2011. Т. 17. № 1. C. 229-244.

ON DUAL REGULARIZATION IN CONVEX PROGRAMMING IN UNIFORMLY CONVEX SPACE

A.A. Gorshkov

Uniformly convex reflexive Banach spaces are proposed to be used instead of Hilbert spaces introduced earlier in the dual regularization method for convex programming problems. By an illustrative example of an optimal control problem for a linear parabolic equation, we show a real gain achieved by the use of uniformly convex Banach spaces as spaces of the optimiz -ation problem for admissible elements and the operators given by constraints.

Keywords: convex programming, sequential optimization, minimizing sequence, uniformly convex space, reflexive space, Lagrange principle, Kuhn-Tucker theorem in nondifferential form, duality, regularization.

i Надоели баннеры? Вы всегда можете отключить рекламу.