Несколько замечаний об итерационных градиентных и квази-градиентных методах приближенного решения нелинейных операторных уравнений

Евхута О.Н.; Забрейко П.П.

5. Трубников Ю.В. Экстремальные конструкции в негладком анализе и операторные уравнения с аккретивными нелинейностями. М., 2002.

Южно-Российский государственный технический университет 19 сентября 2005 г.

УДК 513.8

НЕСКОЛЬКО ЗАМЕЧАНИИ ОБ ИТЕРАЦИОННЫХ ГРАДИЕНТНЫХ И КВАЗИ-ГРАДИЕНТНЫХ МЕТОДАХ ПРИБЛИЖЕННОГО РЕШЕНИЯ НЕЛИНЕЙНЫХ ОПЕРАТОРНЫХ УРАВНЕНИЙ

The new method and general scheme of interative gradient and quasi-gradient methods foe approximate solution of nonlinear operator equations in Hilbert spacas is presented.

1. Пусть X - вещественное гильбертово пространство; f (х) - определенный на шаре в(х0, R) с X и принимающий значения в X дифференцируемый оператор. Среди удобных методов приближенного решения нелинейного операторного уравнения

f (х) = 0 (1)

наиболее известны и изучены метод Красносельского-Крейна минимальных невязок, метод наискорейшего спуска, детально изученный в работах Л.В. Канторовича [1] и метод минимальных ошибок. В первом из них приближения к точному решению уравнения определяются равенствами

х„+1 = Х„ -fffbà f (хп ), ( n = 0,1,2,...), (2)

||f '(хп )f (хп )2

во втором

xn+1 xn

_If(xn I_f (x ) (n - 0 1 2 )

(( (xn )f (xn ) f (xn )) (Xn 1 ( n = 0'1'2'...) '

в третьем

If (xn )||2

f '(xn I f (xn )

-f'(xn )) f (xn ), ( n - 0,1,2,...).

(3)

(4)

Основной идеей в этих (и многих других) методах является переход от заданного приближенного решения уравнения к новому «более хорошему» приближению '% = '% + № ; этот переход осуществляется в два шага. Сначала определяется направление И сдвига от точки к § ; в первых

двух методах, упомянутых выше, это направление совпадает с направлением невязки / исходного приближенного решения, в третьем - с направлением //которое при естественных ограничениях на /(х) образует с направлением невязки «острый» угол. Затем, по тем или иным соображениям, определяется направление и величина сдвига t по выбранному направлению к; в любом случае этот выбор осуществляется таким образом, чтобы выполнялось неравенство

/1 <1V(4 (5)

которое и характеризует тот факт, что новое приближение лучше старого

Для проверки основного неравенства (5) используется элементарная формула

\\а + ХЬ||2 = ||а||2 + 2Х(а,Ь) + Х2 ||Ь||\ (6)

в которой для методов минимальных невязок и наискорейшего спуска

а = /(хп), Ь = /'(хп)/(хп), (7)

а для метода минимальных ошибок -

а = / (Хп ), Ь = / (хп ) /'* (хп ) / (хп ). (8)

Число X выбирается по-разному: для метода минимальных невязок так, чтобы левая часть равенства (6) была минимальной [2], а для метода наискорейшего спуска и метода минимальных ошибок [3] таким образом, что-

II 1|2

бы первые два слагаемых сократились до - а . Эти соображения приво-

дят к равенству

^--И (9)

для метода минимальных невязок и

II2

на

Х = -

Ц2

(а, Ь)

для методов наискорейшего спуска и минимальных ошибок.

Возникает естественный вопрос о возможности применения описанных соображений к другим методам подобного типа. Например, можно пытаться рассмотреть метод, для которого а и Ь выбираются в соответствии с (8), а X - исходя из соображения, чтобы левая часть (5) была наименьшей из возможных, т.е. как в (9). Это приводит к следующим итерациям для приближенного построения решений уравнения (1):

Kn+1

f '(xn ) f (xn )

f' (xn )f '(xn )* f (xn ^

2

f' *(xn)f(xn) (n = 0,1,2,...). (10)

Естественно для анализа этих приближений можно повторить все рассуждения, которые обычно используются при исследовании приближений (2)-(4).

Опишем общую схему таких построений.

Все перечисленные выше методы могут быть записаны в виде

хп+1 = хп-Л( хп )Т (хп) (п = 0,1,2,...), (11)

где Т(£) - оператор, определяющий направление перехода от известного

приближенного решения £ уравнения (1) к новому улучшенному ; Л (§) - функционал, определяющий величину сдвига в этом направлении. Будем предполагать выполненными условия:

Л(х)||T(х)||< с(г)||/(х)||(||х- хо|| < г,0 < г < R), (12)

\\/(х)2 -2Л(х)(/(х),/(х)Т(х)) + Л2 (х)||/(х)Т(х)2< ^2 (г)||/(х)||2(13)

(Iх- хо|| < г,0 < г < R)

(это условие кажется достаточно странным и неестественным; однако это не так - ниже будут рассмотрены его некоторые естественные частные случаи) и

\\/'(х)-/'(х2)Ц< ©(г,\\х -х2||) х -х0Цх2 -хо|| < г,0<г < R), (14) где функции с (г )(0, R]^( 0, да) и q (г): (0, 0,1) определены на [0, R] и неубывающие, ю(г, t) - функция двух переменных г е[0,R], t е [0,2R], неубывающая по обеим переменным и удовлетворяющая условию ю(г, () ^ 0 при t ^ 0 для каждого фиксированного г. Пусть еще

а = ||/(х0 | (15)

Положим

d (г, ф) = q (г )ф+П( г, с (г )С (г )ф), (16)

t

где 0.(г, ^ = |®(г, т)! т.

0

Функция (16) является выпуклой, при малых положительных ф удовлетворяет неравенству С (г, ф)< ф . Обозначим через ф*(г) наименьший корень уравнения

ф = С (г,ф),

если он существует, и пусть ф* (г) = Я в противном случае. Положим еще

да /X

®(г,Ф)= X ё(п)(г,ф) (0 <ф<ф*(г)), (17)

п=0

где ё(п)(г,ф) = ф (п = 0,1,2,...)- обычные итерации функции ё(г,ф):

ё(0) (г,ф) = ф, ё{п+1)(г,ф) = ё(г,ёп (г,ф)) (п = 0,1,2,...),

а ряд в правой части (17) сходится, так как при каждом фиксированном ф< ф*(г) ряд мажорируется геометрической прогрессией со знаменателем

ф-1ё (г, ф)<1 (последнее верно в силу того, что функция ф-1ё (г, ф) является на [0, Я] возрастающей). Функция (17) определена только на интервале (0, ф* (г)) и для нее справедливо тождество

со(г, ф) = ф + ®(г, ё (г, ф)) (0 <ф<ф* (г)). Отметим еще неравенство

з(г,ф)<-

ф

2

ф- d (г,ф)

и справедливость вытекающего из него равенства

lim ю(г,ф) = 0

ф^С

Теорема 1. Пусть оператор f удовлетворяет условиям (12)-(15); число a определено равенством (15) и при некотором r выполнены неравенства

c(r )ro(r,a)< r. (18)

Тогда уравнение (1) имеет в шаре B(x0 ,r) решение x*, приближения (11) сходятся к этому решению, и справедливы неравенства

k+1 -xn\\ < С(r)d(r,||f (xn)||) (n = 0,1,2,...), (19)

\xn -x*\\ < c(r)ю(r, d(n)(r,a)) (n = 0,1,2,...). (20)

В частности, приближения (11) сходятся не медленнее геометрической прогрессии со знаменателем a~ld (r, a), а показатель Ляпунова этой сходимости не превышает q(r).

Проведем рассуждения сначала при дополнительном предположении, что все элементы xn (n = 0,1,2,...), построенные при помощи равенства (15), остаются в шаре B(x0 ,r) и, более того, справедливо неравенство

Ell xn+i- xn|| <r; (21)

n=0

в этом случае верны также неравенства

I|xn - x^ll < r.

Из очевидного в силу (11) тождества

/ (хп+1 ) = / (хп )-Л( хп ) Г ( хп )t ( хп ) + / ( хп+1 )-/ ( хп )-/' ( хп )( хп+1- хп )

и условия (13) вытекают соотношения

\\/(хп )-Л(хп )/' (хп )Т (хп ))2 =1 / (хп ))2 -2Л(хп )(/(хп ), /' (хп )Т (хп )) +

+Л2 (хп)|/(хп)т(хп)2 < q2 (г)||/(хп))2.

Поэтому

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

||/(хп)-Л(хп)/(хп)Т(хп)|| < q(г)||/(хп)||. (22)

Оценка второго слагаемого следует из стандартного неравенства

||/ (хп+1 ) - /(хп )- /' (хп )(хп+! - хп )|| < О (г,\хп+! - х„ |) , откуда в силу (12) следует

\\/(хп+1)-/(хп )-/' (хп )(хп+1)-<О(г, с (г )||/ (хп )|) (п = 0,1,2,...). (23) В результате из (22) и (23) получаем неравенство

\\/(хп+1 ))< С(г\/(хп))) (п = 0,1,2,...), (24)

где функция С (г,ф) определена равенством (16). Подчеркнем еще раз, что это неравенство выведено в предположении справедливости (21).

При 0 < ф < ф*( г) справедливо неравенство С (г, ф)< ф ; поэтому из

(24) следует, что последовательность (/(хп Ц)^ стремится к нулю. Более того, справедливы неравенства

\\/(хп)||< С(п)(г,а) (п = 0,1,2,...). (25)

Далее снова в силу (12)

\хп+1 -х„|| < с(г)С(п) (г,а) (п = 0,1,2,.)

и поэтому

да да

Е ||хп+1 -хЩ < с(г)Е С(п) (г,а) = с(г)м>(г,а).

п=0 п=0

Таким образом, неравенство (21) будет выполняться, если выполнено (18).

Итак, показано, что при выполнении неравенства (18) приближения (11) определены при всех п = 0, 1, 2, ... и выполнено неравенство (21). Но

оно, в частности, означает, что последовательность (хп) да=0 фундаментальна. Следовательно, последовательность приближений (11) (хп) да=0 сходится к некоторому элементу х*.

Далее, переходя к пределу п ^да в (11), получаем тождество Л(х*)Т(х*) /(х*) = 0 , откуда следует /(х*) = 0 .

Остается установить неравенства (19) и (20); (19) следуют из (12) и (24). Для доказательства (20) достаточно заметить, что при каждом п = 0, 1, 2, ... в силу (25)

X X )

||*п -х*|| < Е X+1 -хк\ < с(г)£ ((к>(г,а) =

к=п к=п

X

= с(г) Е ((кV,((п)(г,а)) = с(г)м>(г,((п)(г,а)). к=0

Утверждение о сравнении скорости сходимости приближений (11) со скоростью геометрических прогрессий и о показателе Ляпунова этой сходимости следует из (11) и элементарных неравенств

((п+1) (г,а)= ((г(;)(г,а)) ((п)(г,а) < «/Ф ((п)(г,а)

((п)( г, а) ||/( Х0 )||

п = 0, 1, 2, ...

Сделаем несколько замечаний об условии (13). Нетрудно видеть, что оно означает, что значения функционала Л должны содержаться между двумя вещественными корнями квадратного трехчлена

п(хД)=(1-д2(г))-2,Ш/Щ) 1/,(х)Т(х)12 .

1/И12 II/(2

Факт существования этих корней эквивалентен неравенству

(/(X), /'(х)Т(X)) > (1 - д2 (г)) ||/(х)||2 |\/'(х)Т(х)||

(х е В(х0, г), 0 < г < Я), (26)

которое, конечно, недостаточно для выполнения (13), однако оно выполняется, если положить

Л(х)=/х/Щ». (27)

||/'(х)Т (х)||2

Этот случай соответствует методу минимальных невязок (2) при

Т(х) = /(х) и методу (10) при Т(х)= /'(х)*/(х). В некотором смысле

можно считать, что описанный выбор функционала Л для рассматриваемых методов является оптимальным из возможных.

Для метода наискорейшего спуска и метода минимальных ошибок функционал Л выбирается иным способом. Естественно при этом вместе с необходимым условием для /(х) и Т(х) приходится предполагать выполненными и некоторые дополнительные условия.

Положим

Л(х)= ^/(х)1|2 , (28)

(/(х), /'(х) Т (х))

где д - некоторая постоянная. В этом случае (13) перепишется в виде

( о 2 2 ^

! - 2q+sflf)TM

(f (x), f' (x) T (x ))2

< q2 (r).

Н 1-Я2 (г) Нетрудно видеть, что оно может выполняться лишь при д>--; при

этом условии оно равносильно неравенству

||/(4 |\/'(х)Т(х)|| <д/д2(г)-1 + 2д (/(х), /'(х)Т(х)) " д

и является наименее ограничительным, когда правая часть этого неравенства является наибольшей, т.е. при д = 1- д (г); в этом последнем случае оно превращается в неравенство

(/(х), /'(х)Т(х))>д/1-д2 (г) ||/(х)||||/' (х) Т(х)\\,

которое является несколько более жестким, чем необходимое условие (26). Выбор (28) для функционала Л соответствует методу наискорейшего спуска (3) при Т(х)=/(х) и методу минимальных невязок (4) при

Т(х)= /'(х)* /(х).

Сравнение условий (26) и (28) показывает, что второе из них является более жестким. Тем самым сходимость методов наискорейшего спуска и минимальных ошибок имеет место при более жестких ограничениях, чем сходимость метода минимальных невязок и нового метода (10).

2. Сформулируем вытекающее из теоремы 1 утверждение об условиях сходимости для метода (10). В этом случае функционал Л определяется равенством (27) и сам метод можно рассматривать при выполнении условия (26).

Будем предполагать, что производная /'(х) при всех хе В(хо,г) удовлетворяет следующим условиям:

р(г)||к||2 <||(/'(х)*)-1 к|| ||/ (х)И\\ < х(г)к2 (29)

(||х - х0|| < г, 0 <г < Я, к е X), ||/' (х)к\\ > Кг)||к|| (||х-<г, 0<г<Я, к еX). (30)

Здесь функции р(г), х(г), ц(г):(0,Я] ^ (0,да) определены на [0, Я] и первая и третья из них - неубывающие, а вторая - невозрастающая.

Условия (29) могут показаться неестественными. Однако в действительности постоянные и в этих условиях просто оцениваются через такую важную характеристику линейного оператора, как его мера обусловленности. Соответствующие оценки имеют вид

p(r) > inf

1

X(r ) < sup \\f' (x)-1|| f' (x)||.

IIх-х0>11 <г||/' (х)^||/ (хщ ||х-хс||<г"

Анализ функций р( г) и х(г) не проводился.

В рассматриваемом случае функционал Л определен равенством (27); для него выполнено условие (12) с с(г) = у-1(г)р-1(г), так как в силу левого неравенства (29) и неравенства (30)

Л( х )| Т (х )||=( / (х),/(х) / * х)* / (х)) / (х)* / (х)|| /' (х) /' (х)* / (х)

I f (x)* f(x)\ || f'(x)* f (x)

f (x) f (x)* f( x) \\f (x)||

f (x) f (x)* f(x)

-<v 1(r )p 1(r).

Условие (14) в форме (26) также выполнено, так как в силу правого

неравенства (29) при q(r) = \r)

II 2

-1,

(f (x), f' (x) T (x)) =

f'(x)* f (x)|| >x-1(r)||f (x)|| I f'(x)f'(x)* f (x)||

= Х (г)\\/(х) /' (х)Т(х)

Теорема 2. Пусть оператор / удовлетворяет условиям (14), (29), (30), а определено равенством (15) и выполнены неравенства

у-1( г )х-1(г) г, а)< г.

Тогда уравнение (1) имеет в шаре В(х0,г) решение х* приближения (11) сходятся к этому решению, и справедливы неравенства

|х„+1 - х„\<у-1( г )х-1(г) й (г,||/( хп )||) (п = 0,1,2,.),

\\хп+1 - х*||<у-1(г) х-1( г) *(г, й(п) (г, а)) (п = 0,1,2,...),

В частности, последовательность приближений (10) сходится не медленнее геометрической прогрессии со знаменателем а-1 й(г, а); показатель Ляпунова этой сходимости не превышает -^1-х-1(г) .

3. Описанная выше схема исследования итерационных методов вида (11) может быть использована и в частном случае, когда оператор-функция Т(х) имеет вид Т(х) = Т/(х) (Т - фиксированный линейный оператор), а функционал Л(х) не зависит от х. Иными словами, разработанная выше схема применима и для исследования последовательных приближений вида

хп+1 = хпТ/ (хп) (п = 0,1,2,.), (31)

2

где число X выбирается некоторым способом заранее. Однако в этом случае более естественно применять и обычные подходы, основанные на использовании принципа сжимающих отображений Банаха-Каччиопполи или принципа мажорируемых отображений Канторовича, так как в этом случае приближения (31) оказываются обычными последовательными приближениями, примененными к оператору Dx = x - X Tf (x).

В предположении, что оператор f дифференцируем по Гато и его производная ограничена на каждом шаре B(x0,r), (0 <r <R), некоторой постоянной, из теоремы Лагранжа вытекает, что оператор D удовлетворяет условию Липшица

||D x1 - Dx2|| < к(r) ||x1 - x21| (x1, x2 e B(x0 ,r), 0 < r < R),

где

к (r ) = sup ||l -X Tf' (x)||. (32)

xeB( x0 ,r)

Известно [4], что условия сходимости метода минимальных невязок и грубая оценка его скорости сходимости могут быть получены при помощи принципа сжимающих отображений по крайней мере в случае уравнений с потенциальными нелинейностями. Аналогичное утверждение в общем случае оказывается неверным. Неясно даже в простейших случаях, справедливы ли аналогичные утверждения для метода наискорейшего спуска или метода минимальных ошибок.

Как оказывается, применение принципа сжимающих отображений приводит к несколько иным условиям сходимости. Здесь в первую очередь играет роль вычисление или, возможно, более точная оценка функции (32). Опишем здесь случай, когда производные f (x) (x e B(x0,r)) удовлетворяют условиям

v(r)||h||2 <(Tf (x)h, h)<Kr)||h||2, \\Tf (x)J<CT(r) (x e B(x0,r), 0 < r < R), где v( r) и ц( r) - некоторые функции, первая из которых не возрастает, а вторая не убывает; ст( r) - неубывающая функция.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Очевидно,

||I-XTf'(x)|| < |I-X(Tf'(x))r|| +X||(Tf'(x)),||,

где символы Nr и N означают переход от рассматриваемого линейного оператора N к его вещественной и мнимой частям:

_ N + N*T N - N *

Далее

||/-Х( Tf'(x)) r||< sup |1 -X/1 = max {|l-Xv(r)|,| Xv(r)-1|} + Хст(г) и,

v( r ) < t <ß(r )

таким образом,

\\1 - X Т /'(х)|| < шах{1-Ху(г) |,| Ху(г) -1| }+ X ст(г).

2

Минимальным это выражение является при Х=-; при этом

ц(г )+у(г )

значении X предыдущая оценка сводится к неравенству

||/-XТ/'(х)||< ^(г)-У(г)+"^)СТ(г). 11 11 ц(г ) + у(г)

Таким образом, если

ст(г) < у(г), (33)

2

то оператор Б=I--Т/'(х) является на шаре В(х0, г) операто-

ц( г ) + у( г)

ц(г) -у(г) + 2 ст(г)

ром сжатия с постоянной к (г) = --.

ц(г) + у(г )

Если, кроме того,

|/(*0 )||<(у(г)+ст(г))г, (34) то исходное уравнение / (х) = 0 имеет в шаре В( х0, г) решение х* и последовательные приближения (31) сходятся к этому решению. Подчеркнем, что здесь число Х=-2- зависит от выбора г и должно быть

ц(г )+у(г )

одним и тем же при всех п = 0, 1, 2, .... Это означает, что сначала нужно выбрать число г таким образом, чтобы выполнялись неравенства (33)-(34), а затем в соответствии с этим г выбрать число X.

Анализ условий сходимости (33), (34) обычных последовательных приближений (31) и условия сходимости (18) приближений (11) показывает, что в общем случае они оказываются несравнимыми.

4. В заключение отметим, что все приведенные здесь рассуждения без существенных изменений переносятся на нелинейные операторные уравнения в банаховых пространствах X, обладающих свойством Бынума (напомним, что свойство Бынума означает справедливость неравенства)

\\а + X Ь||2 < |\а\\2 + 2Х [а, Ь] + 9 X21|Ь||2. (35)

в котором 9, 9 > 1 - некоторая постоянная, а [а, Ь] - полускалярное произведение Лумера в X. В частности, неравенство (35) с 9 = р - 1 выполнено в пространствах Ьр и 1р с 9 = р - 1.

Стандартным способом построения этой работы распространяются и на комплексные гильбертовы или банаховы пространства.

Литература

1. Канторович Л.В., Акилов Г.П. Функциональный анализ. М., 1984.

2. Забрейко П.П., Кирсанова-Евхута О.Н. //Весщ НАН Беларуси 2004. № 2. С. 5-8.

3. Кирсанова-Евхута О.Н. // Докл. НАН Беларуси. 2004. Т. 48. № 2. С. 10-15.

4. Красносельский М.А. и др. Приближенное решение операторных уравнений. М., 1969.

Южно-Российский государственный технический университет,

Институт математики НАН Беларуси 7 сентября 2005 г.

УДК 330.115

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ЭНДОГЕННОГО ЭКОНОМИЧЕСКОГО РОСТА

The paper is concerned with a mathematical model of economic growth, which is principally based upon the factor of the technological change. Mathematically, the criterion of the technological change is expressed by a respective growth of the elasticity coefficient with respect to the capital. It is shown that with this factor increasing there is possible an unbounded accumulation of capital. On the example of the USSR's 1961-1985 economy it is shown that it was possible to choose such distribution of investments to research sector during the considered period of time, which could significantly result in a higher capital accumulation.

Введение

Исследование внутренних механизмов влияния научно-технического прогресса на эндогенный экономический рост всё ещё остаётся одной из главных нерешённых проблем в моделировании экономических систем. Другими словами, до сих пор не раскрыта суть той движущей силы, той «пружины», которая, подобно пружине часового механизма, является первопричиной постоянного экономического роста и социального прогресса.

К теориям, ставшим уже классическими, можно отнести модели Лукаса [1], Ромера [2], Агитона - Ховитта [3]. Подробный сравнительный анализ этих моделей можно найти в [4].

В настоящей работе показывается, что рост эластичности производственной функции по фактору капитал в рамках неоклассической модели роста Солоу [5] может приводить к существенному росту накоплений. Мы предлагаем несколько моделей, которые затем тестируются на примере экономического развития СССР за период 1961-1985 гг. Показывается, что увеличение инвестиций в научно-технический сектор могло бы привести к увеличению темпов роста экономики на 10-15 %. Формулируется некоторая задача оптимизации, решение которой позволяет установить оптимальный уровень таких инвестиций, необходимый для достижения максимального темпа экономического роста.

Аннотация научной статьи по математике, автор научной работы — Евхута О. Н., Забрейко П. П.

Похожие темы научных работ по математике , автор научной работы — Евхута О. Н., Забрейко П. П.