Научная статья на тему 'О методе наискорейшего спуска для уравнений в банаховых пространствах со свойством Бынума'

О методе наискорейшего спуска для уравнений в банаховых пространствах со свойством Бынума Текст научной статьи по специальности «Математика»

CC BY
63
13
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Евхута О. Н.

Исследуются нелинейные операторные уравнения в банаховых пространствах со свойством Бынума. Показано, что классические методы наискорейшего спуска применимы к уравнениям f(x) = 0 с оператором, действующим в банаховом пространстве со свойством Бынума при естественных ограничениях, аналогичных тем, которые требуются и в случае, когда пространство гильбертово.The new result on the convergence of the steepest descent method for nonlinear operator equations in Banach spaces with Bynum inequality is presented.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О методе наискорейшего спуска для уравнений в банаховых пространствах со свойством Бынума»

Работа выполнена по проекту «Графы и сети с нестандартной достижимостью» по разделу 3.3 Развитие научно-исследовательской работы молодых преподавателей, научных сотрудников, аспирантов и студентов по ведомственной научной программе Минобразования РФ «Развитие научного потенциала высшей школы» (рук. проекта Я.М. Ерусалимский).

Литература

1. Скороходов В.А. Графы с магнитной достижимостью. Марковские процессы и потоки в сетях. Ростов н/Д, 2003. Рукопись деп в ВИНИТИ. № 410-В2003.

2. Феллер В. Введение в теорию вероятностей и ее приложения. Т. 1, 2. М., 1967.

Ростовский государственный университет 2 7 сентября 2005 г.

УДК 513.88

О МЕТОДЕ НАИСКОРЕЙШЕГО СПУСКА ДЛЯ УРАВНЕНИЙ В БАНАХОВЫХ ПРОСТРАНСТВАХ СО СВОЙСТВОМ БЫНУМА

© 2005 г. О.Н. Евхута

The new result on the convergence of the steepest descent method for nonlinear operator equations in Banach spaces with Bynum inequality is presented.

1. Одним из наиболее распространенных методов приближенного отыскания решений нелинейного операторного уравнения

f (x) = 0 (1)

с дифференцируемым (по Фреше) оператором f действующим в вещественном гильбертовом пространстве X, является метод минимальных невязок (см., например, [1], где приведена достаточно полная библиография). Этот метод состоит в последовательном построении приближений

(f jXn )f(Хп \ f(xn)) f(х ) = 0 (2)

WfU)f(xn)2 '

которые при естественных предположениях о левой части fx) уравнения (1) оказываются сходящимися к точному решению х* уравнения (1).

Существуют различные методы исследования приближений с (2). В значительной части из них анализ приближений (2) основывается на явлении релаксации невязок, т.е. на уменьшении ||f (хп)|| при переходе от

приближения с номером п к приближению с номером п + 1. В [2] была предложена общая схема исследования приближений (2) на этой основе, а в [3] эти результаты были распространены и на уравнение (1), левая часть которого является оператором в банаховых пространствах, обладающих некоторым специальным свойством - Бынума. При этом сами приближения были заменены на

xn+1 xn

= Хя -[/ (хп } f и )f (х„ )} f ( ) ( =

П+1 П 4/'X )/ X Г

где [•,•] - символ полускалярного произведения, а 4 - число, характеризующее меру отклонения геометрии рассматриваемого пространства X от обычной евклидовой геометрии гильбертова пространства.

Естественно возникает вопрос о возможности распространения этих построений на другие методы приближенного построения решений операторных уравнений (1), которые аналогичны методу минимальных невязок. Здесь в первую очередь имеется в виду метод наискорейшего спуска, приближения в котором определяются равенствами

Х"=^)) >(п=0Д,...). (3)

В работе [4] общая схема из [2] была применена к исследованию приближений (3) для уравнений в гильбертовом пространстве. Цель настоящей работы - изучение возможности применения этой общей схемы для уравнений в банаховых пространствах.

2. Напомним некоторые определения.

Пусть X - вещественное банахово пространство. Вещественная функция двух переменных [•,•]: X х X ^ Я называется полускалярным произведением, если выполнены следующие условия:

а) [х, х} = ||Х|2;

б) [Лх,у}=Л[х,у};

в) [ а1 У1 + а2 У2} = а1 [x, у1} + а2 [x, У2};

[^У}<||х||||у||.

Такие произведения связаны с так называемым дуальным отображением J пространства X, которое определяется как оператор, удовлетворяющий условию Jx еЗХ, где

Зх = {/ е X* : || / II = ||х||, l(x) = ||X|2 }

(зх Ф 0 в силу теоремы Хана - Банаха).

В [3] отмечена эквивалентность следующих шести свойств банахова пространства X:

1.1|х + у||2 +4х - у||2 > 2 (||XI2 у\\2 ) (Х, у е X);

2. IX + Щ2 +1|х - И\2 < XI2 + 241 2 (х,Ь е X);

3. ||(1 -Л)а + ЛЬ\\2 >(1 -Л)Ца||2 +Щ\2 --4(1 -Л)Л\\а - bf (а, Ь е X ,0 < Л < 1);

4. х + к < х ||2 + 2(Зх, к) + 51|к||2 ( х, к е X);

5. (Зх - Зу, х - у) <|| х - у||2 (х, у е X);

6. ||Зх-Зу\\ <||х-у||2 (х,у е X).

Здесь I - некоторое число, 5> 1. Банахово пространство X обладает свойством Бынума, если в нем справедливы неравенства 1-6. Примером таким пространств служат Ьр и 1Р с 2 < р < да; при этом 1 = р - 1. Ю.В. Трубников [5] доказал, что банаховы пространства, в которых справедливо неравенство Ханнера

х +

+ х -

<1 х +

+ х -

р > 2)

также являются пространствами со свойством Бынума (снова с 1 = р - 1). В полной мере объем класса банаховых пространств со свойством Бынума остается неясным.

Основная идея распространения метода минимальных невязок на случай банаховых пространств связана с изучением возможности замены скалярного произведения полускалярным. Напомним, что выбор на каждом шаге числового коэффициента перед /хп) обосновывается следующим образом: если задано приближенное решение линейного уравнения

Ах = Ь, то «лучшее» приближенное решение естественно искать в виде

§ = - - Ь); при этом коэффициент X выбирается таким образом,

ЛЛ

чтобы минимизировать функционал Ф

A b

. Применение этой

схемы к возникающему на каждом шаге построения приближений по методу минимальных невязок линейному уравнению /'(хп) = /(хп)

(здесь, конечно, = хп) и приводит к равенствам (1) в случае гильбертова пространства и (3) (с некоторыми естественными оговорками) в случае банаховых пространств со свойством Бынума.

Аналогично в методе наискорейшего спуска (3) выбор числового коэффициента перед /хп) обосновывается такими же соображениями, однако теперь при уточнении приближенного решения линейного уравнения

Ах = Ь новое «лучшее» приближенное решение

выбира-

образом, чтобы минимизировать функционал

ется таким

ЛЛ Л ~

¥

A 2b, |

. В случае гильбертова пространства это приводит к

2

равенствам (3), однако в случае банахова пространства написать естест-

( ~

венный аналог функционала Т £ - A £- 2b, £ не удается.

V / V /

Однако существует иное, хотя и более формальное, эвристическое обоснование метода наискорейшего спуска. Именно при переходе от приближенного решения £ к «лучшему» £ линейного уравнения Ax = b естественным образом возникает скалярная функция

s(a)=| |a(£-A(A£- b))-b||2, (4)

которая в случае гильбертова пространства является обычным квадратным трехчленом

s(a) = ||A£ - b||2 - 2A ((((£ - b) A£ - b) ) + A2 ||a(( - b)2.

Параметр A выбирается таким образом, чтобы новое приближение £

оказалось лучше старого, т.е. чтобы выполнялось неравенство S(A) < S(0). В методе минимальных невязок этот выбор осуществляется так, чтобы значение S(A) было наименьшим из возможных. В методе наискорейшего спуска - чтобы первые два слагаемых в выписанной выше квадратичной

форме оказались подобными и в сумме дали - ||A£ - b||2. Именно при таком выборе A и возникает (3).

В случае банаховых пространств функция S(A) не является квадратным трехчленом. Однако в банаховых пространствах со свойством Быну-

ма она мажорируется квадратным трехчленом s(a) :

s(a)<s(a) (5)

где

s(A) = ||A£ - b||2 - 2 A [ - b, A ((£ - b)] + SA2||A ((£ - b)2. Поэтому и здесь коэффициент A при переходе от приближенного решения £ к «лучшему» £ можно выбирать таким образом, чтобы значение

квадратного трехчлена S (a) было минимальным из возможных, что приводит к аналогу метода минимальных невязок, приближения в котором определяются равенствами (3); можно выбирать иначе, так, чтобы первые два слагаемых в квадратичной форме оказались подобными и привелись к

-1 |A£ - b||2; в этом случае мы приходим к выражениям

хп+1 = Хп -Т^Ф^Т^ТТ) = 0Д'2"")' (6)

[/ (Хп > Т (Хп )Т (Хп П

которые являются аналогом приближений в методе наискорейшего спуска. Отметим, что (6) отличаются от соответствующих приближений (3) только заменой символа скалярного произведения на символ полускалярного.

3. Пусть X - вещественное банахово пространство со свойством Быну-ма; Т(х) - дифференцируемый оператор, определенный на шаре в(хо , Я)с X пространства X и принимающий значения в том же пространстве. Предположим далее выполненными следующие условия:

[/,Т'(х)/] >у(г)||Т'(Х)и||||и|| х- Хо|| < Г 0 < г < Я, /г е X); (7)

[/, Т'(х)/]>5(г)||/||2 (||х - хо|| < г, 0 < г < Я, И е X); (8)

\\/'(Х) -Т'(Х2)||< к(г) ||Х - х2 || (IХ - Х^|, ||Х2 -Хо\\ < г, 0 < г < Я). (9)

Функции у(г), 5(г) и к(г) определены на [0, Я]. Первая из них - невоз-растающая, а вторая и третья - неубывающие.

Ниже нам понадобятся функции

-2 2

¿(г,ф) = ^у-2(г)-!ф + к(г)5 2 (г)Ф , (10)

252(r) jji--^у-2(r)-1

ф*( г ) =--(11)

к (г)

ТО

*(г,ф)=£ Л (п)(г,ф*} (0 <ф<ф*( г)), (12)

п=0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где Л(0)(г, ф) = ф и Лп)(г, •) (п = 0, 1, ...) определены рекуррентными равенствами

Лп + 1)(г, ф) = Лп)(г, Л г, ф) (п = 0, 1, ...). Теорема 1. Пусть производные Т (х) функции /(х) удовлетворяют условиям (7)-(9) и г удовлетворяет неравенству

5-1 (г) *(г, а)< г (а = ||Д Хо )||). (13)

Тогда уравнение (1) имеет в шаре в(хо, г) решение х*, приближения (6) сходятся к этому решению и справедливы оценки:

Ьп+1 - Хп\<5-1(г )Л (г,\Т (Хп )||) (п = 0,1,2,...), (14)

||хп - х*|| < 5-1(г)ю(г, Л(п)(г, а)) (п = 0,1,2,...). (15)

Ляпуновский показатель этой сходимости определяется равенством

Х = ^у-2 (г )-1. (16)

Доказательство. Очевидно,

f (xn+1 ) =

f (Xn )-|

f (x

f '(Xn )f (Xn )

[[ (Xn ), f '(Xn )f (Xn ))

V

+ ( f(Xn+1)-f(x. )- f' (Xn )(Xn+1 - Xn )).

^ V п/\ п+1 п)

Для первого слагаемого правой части в силу (4) имеем

2

f (Xn )-

If (x

[[ (Xn ) f '(Xn )f (Xn ))

f '(Xn )f (Xn )

<

< -

f X ) + f (x. bfff1 f )f (Xn )=

[[ (xn )) f (xn )f (xn )] 2 ^

Ц f (x. \f' (x. )f (x. [/ fa ) f' (x. )f (x. )]2

— 1

\\f (Xn ) ,

откуда, в силу (7),

llf (Xn )2

f (x. )-

[/ (x. ), f' (x. )f (x. ))

f '(x. )f (x

>/sy-2 (r)-i||f(Xn)||. (17)

Для второго слагаемого, проведя стандартные преобразования и применяя (7), получим

||/(хп+1)- /(хп)-Г(хп)(хп+1 - ХпI < к(Г^Х"2+1 ХП ,

откуда и из неравенства ||хп+1 -хп||<5-1 (гЦ/(хпЦ (п _ 0,1,—справедливого в силу (8), вытекает оценка

II/(Хп+1)-/(Хп)-/'(Хп)хп+1 - Хп) < к(г)5-2(г21/(Хп ^ . (18) В результате из (17) и (18), получаем неравенство

||/(Хп+1 )|< й (г,||/(Хп Ц) (п = 0,1,—) (19)

где й(г, ||/(хп Ц) определено равенством (10).

Определенная при 0 < ф< ф* (г) функция й(г,ф) обладает свойством

й(г, ф) < ф ; поэтому последовательность (/(хп Ц)^ стремится к нулю. Более того, справедливы неравенства

\\/(Хп й(п)(г, а) (п _0,1,—). (20)

Далее снова в силу (9)

ТО ТО

Е К+1 _хп\ < 8-1(г) Е||/(хп)||а(п)(г,а) <

п=о п=0

ТО

< 8-1(г) Е а(п)(г,а) =5-1(г)м>(г,а) < г (21)

п=0

ряд в правой части сходится в силу неравенства (12). Из этих неравенств следует, что все приближения (6) определены при всех п = 0, 1, ... и лежат в шаре в(хо, г). Более того, из него следует, что последовательность приближений (6) фундаментальна и потому сходится к некоторому элементу х* е в(хо, г). Нетрудно показать, что х„ является решением уравнения (1).

Отметим, что ряд в правой части (21) сходится быстрее геометрической прогрессии со знаменателем

9о = ^ = ^у_2(г)_1 +к(г)5 (г)а; а2

нетрудно видеть, что показатель X сходимости этого ряда равен (16).

Очевидно, неравенство (14) вытекает из условия (8) и неравенства (19).

Далее в силу (8) и (20)

||хп _х*|| < Е \\хк+1 _Хк\ < 8-1(г) Е\\/(Хк)|| <

к=п к=п

ТО

<5-1(г) Е а(к)(г,а) = м>(г,а(п)(г,а)),

к=п

т.е. справедливы и неравенства (15). Теорема доказана.

4. Сделаем несколько замечаний. Прежде всего отметим, что проверка условия (13) связана с вычислением функции (12) и является достаточно трудоемкой задачей. Однако в силу очевидного неравенства

Ф

w(r, ф) <

i—VY^—Т- *(r^22(r)ф

оно может быть заменено на более жесткое, но совершенно простое условие

—2

a i ak(r)S (r) i 2

+ ^ ^ + (г)_1 < 1. (22)

гб(г) 2

Далее заметим, что условие (9) может быть значительно ослаблено. Например, его можно заменить предположением

\/ ' (х1)_ / (х2 )< к (г )|| х _ 0 (х1 _ хо\\, ||х2 _ хо|| < г, о < г < я) где 0 - некоторое число из (о, 1); в этом случае функция (1о) должна быть заменена на

d (^-/¡¡Т^ ф+* )Ф" \5Pr).

Функция (11) в этом случае оказывается равной

( „. f I-:-W/e

(1 + 9) 5-(1+e)(r)(1^Sy-2(r)-1

Ф*(г) =

(12) удовлетворяет неравенству

^(г,ф)<

k (r)

1-VSTv)^ -k (r )5-(1+e)( r )ф9'

y 1 + 9

Для выполнения условия (13) достаточно выполнения неравенства

а9 k(r)5-(1+e)(r) I 2

5т-) ^"Г 8 + )-1 < 1. (23)

г 5(г) 1 + 8

Без труда рассматривается и случай, когда вместо (9) предполагается выполненным условие

\\/' (Х1) - /' (Х2 ) < w (г, ||Х1 - ) (|Х1 - х0|, ||Х2 - Х>|| < г, 0 < г < Я) где ^(г, г) - функция двух переменных г е [0, Я], г е [0, 2Я], неубывающая по г и удовлетворяющая условию ^(г, г) ^ 0 при г ^ 0 для каждого фиксированного г. В этом случае функция (10) определяется равенством

I--Г г Л

й(г,ф)_у&у-2(г)-1 ф + □(г,5-1(г)ф) П(г,г) _ |м>(г,т)йт

I 0 )

Формула для функции (11) здесь в явном виде не выписывается, однако аналог достаточных условий (22) и (23) выписывается без труда. Именно условие (13) выполняется, если

^ + + ^5-1(г )ф) < 1. г5(г) а

5. Производные /'(х) (хеВ(х0,Я)) оператора/:B(x0,R)(<X)^Xв силу условий (7) и (8) должны обладать некоторыми специальными свойствами. Соответствующие свойства для действующего в банаховом пространстве X линейного оператора Т записываются в виде

\к,Тк\ > у \\ТИ\\Щ\, [к,Тк}<<5 \ТН\2 ;

они даже в случае гильбертова пространства, насколько известно автору, систематически не изучались [2]. Оба эти свойства вытекают (при соответствующем т) из неравенства т ||Л||2 < [к,Тк], означающего аккретив-

Ф

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ность оператора Т. Условия аккретивности линейных операторов в различных банаховых пространствах изучались, например, в [5].

Отметим еще, что по стандартной схеме теорема 1 легко обобщается и на комплексные банаховы пространства.

6. Сделаем замечание о методе минимальных ошибок, итерации в котором (в случае гильбертова пространства) определяются последовательно равенствами

II/(хп )

Kn+1

f '(Xn ) f (xn )

-f'(xn ) f(xn ) (П = 0,1, ...).

В этих формулах скалярное произведение вообще не участвует и поэтому, на первый взгляд, их изучение в банаховых пространствах не требует никаких «перестроек» в самих формулах. Однако эти формулы для приближенного построения решений уравнения /х) = о, левая часть которого является оператором в банаховом пространстве X, не имеют смысла.

Действительно, если оператор/х) действует в банаховом пространстве X, то и его производная /'(х) при каждом х является линейным оператором в пространстве X. Но тогда оператор /' (х) , сопряженный к оператору /' (х), является уже линейным оператором в сопряженном к X пространстве X. Тем самым суперпозиция/'(х) /х), участвующая в (23), не определена.

Далее может показаться, что такие методы можно применять к уравнениям /(х) = о, левая часть которых является оператором, действующим из банахова пространства X в другое банахово пространство У. В этом случае операторы /'(х) оказываются действующими из сопряженного к пространству У пространства У в сопряженное к X пространство X. Требование, чтобы суперпозиции /' (х) /х) были определены, приводит к дополнительным предположениям, что У = У и X = X, или, хотя бы, что У с У и X с X, которые естественно выполняются, если оба пространства гильбертовы и совпадают, но являются не слишком естественными в случае банаховых пространств. Неясно даже, применим ли к таким пространствам развитый выше подход, так как эти пространства могут не обладать свойством Бынума.

Литература

1. Красносельский М.А. и др. Приближенное решение операторных уравнений. М., 1969.

2. Забрейко П.П., Кирсанова-Евхута О.Н. // Весщ НАН Беларус (сер. ф1з.-мат. навук). 2оо4. № 2. С. 5-8.

3. Забрейко П.П., Кирсанова-Евхута О.Н. // Докл. НАН Беларуси. 2оо5. Март-апрель. Т. 49. № 2. С. 5-1о.

4. Кирсанова-Евхута О.Н. // Докл. НАН Беларуси. 2оо4. Март-апрель. Т. 48. № 2. С. 1о—15.

5. Трубников Ю.В. Экстремальные конструкции в негладком анализе и операторные уравнения с аккретивными нелинейностями. М., 2002.

Южно-Российский государственный технический университет 19 сентября 2005 г.

УДК 513.8

НЕСКОЛЬКО ЗАМЕЧАНИИ ОБ ИТЕРАЦИОННЫХ ГРАДИЕНТНЫХ И КВАЗИ-ГРАДИЕНТНЫХ МЕТОДАХ ПРИБЛИЖЕННОГО РЕШЕНИЯ НЕЛИНЕЙНЫХ ОПЕРАТОРНЫХ УРАВНЕНИЙ

© 2005 г. О.Н. Евхута, П.П. Забрейко

The new method and general scheme of interative gradient and quasi-gradient methods foe approximate solution of nonlinear operator equations in Hilbert spacas is presented.

1. Пусть X - вещественное гильбертово пространство; f (х) - определенный на шаре в(х0, R) с X и принимающий значения в X дифференцируемый оператор. Среди удобных методов приближенного решения нелинейного операторного уравнения

f (х) = 0 (1)

наиболее известны и изучены метод Красносельского-Крейна минимальных невязок, метод наискорейшего спуска, детально изученный в работах Л.В. Канторовича [1] и метод минимальных ошибок. В первом из них приближения к точному решению уравнения определяются равенствами

х„+1 = Х„ f'iff^ f (хя ), ( n = 0,1,2,...), (2)

||f '(хи )f (х„ )2

во втором

xn+1 xn

_If(xn I_f (x ) (n - 0 1 2 )

( '(xn )f (xn ) f (xn )) (Xn 1 ( П = 0'1'2'...) '

в третьем

xMJ-1 xM

If (xn III2

f '(xn )) f (xn )

-f (xn)) f (xn), (n - 0,1,2,...).

(3)

(4)

Основной идеей в этих (и многих других) методах является переход от заданного приближенного решения уравнения к новому «более хорошему» приближению | = № ; этот переход осуществляется в два шага. Сначала определяется направление И сдвига от точки к § ; в первых

i Надоели баннеры? Вы всегда можете отключить рекламу.