Научная статья на тему 'Геометрический смысл метода Ньютона'

Геометрический смысл метода Ньютона Текст научной статьи по специальности «Математика»

CC BY
1362
86
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТОД НЬЮТОНА / РИМАНОВО ПРОСТРАНСТВО / ЧИСЛЕННЫЕ МЕТОДЫ / ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ / NEWTON METHOD / RIEMANNIAN GEOMETRY / CALCULUS OF APPROXIMATIONS / DIFFERENTIALS EQUATIONS

Аннотация научной статьи по математике, автор научной работы — Пчелинцев Михаил Васильевич, Скоркин Николай Андреевич

Обнаруженный геометрический смысл метода Ньютона для решения систем нелинейных уравнений (в бесконечномерном случае операторных уравнений) полностью проясняет его механизм. В практико-прикладном направлении это позволяет объяснить эмпирически наблюдаемые эффекты, получить единую характеризацию метода и его модификаций, общую теорему локальной сходимости и ясное видение геометро-динамической природы проблемы сходимости в целом. Результаты демонстрируются модельным примером.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Пчелинцев Михаил Васильевич, Скоркин Николай Андреевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Geometric sense of the Newton's method

New geometrical sense of Newton methods for solving the system of nonlinear equations (in infinite -measuring case nonlinear operational equations) found by us, clarifies completely its inner mechanism. From the point of view of application it enables to explain empirically observed effects, to get a unified characterization of the method and its modification, to get a general theorem on the problem of local convergence and to get a quite clear vision of geometrical-dynamic nature of convergence problem on the whole (both local and global). The results obtained are demonstrated on the model example.

Текст научной работы на тему «Геометрический смысл метода Ньютона»

Математика

УДК 513.81 +517.92+518.12

ГЕОМЕТРИЧЕСКИЙ СМЫСЛ МЕТОДА НЬЮТОНА

М.В. Пчелинцев, Н.А. Скоркин

Обнаруженный геометрический смысл метода Ньютона для решения систем нелинейных уравнений (в бесконечномерном случае - операторных уравнений) полностью проясняет его механизм. В практико-прикладном направлении это позволяет объяснить эмпирически наблюдаемые эффекты, получить единую характеризацию метода и его модификаций, общую теорему локальной сходимости и ясное видение геометро-динамической природы проблемы сходимости в целом. Результаты демонстрируются модельным примером.

Ключевые слова: метод Ньютона, риманово пространство, численные методы, дифференциальные уравнения.

1. Концептуальные соображения

Метод Ньютона представляет собой формулу перехода от к-го приближения хк численного

решения уравнения Е(х) = 0 соответственно к к+1-му приближению Хк+1, которая имеет вид

Хк+1 = хк-[ВЕ(хк)]"1 Е(хк) • (1)

Хорошо известный в конечномерном случае геометрический смысл формулы состоит в том, что точка хк+1 получается как точка пересечения определенных гиперплоскостей, ортогональных к нормалям (градиентам) гиперповерхностей уровня компонент Е(х) в точке хк [1, 2]. Посмотрим на функцию Е как на отображение из Яп в Яп :

Е: X с Яп ® У с Яп ~ .у = Е(х) ~ / = /г (х1,х2,...,хп) (' = 1,2,...,п),

X = {х:х = (,х2,...,хп) }, У = {у:у = (,у2,...,уп) }, Е(х) = ((х),^(х),...,/п(х)) .

(5Е 5Е ^ А & %■

В общем случае метрический тензор gj|■ = I —-,—- I = > —у—у не задает риманову струк-

V дх' 5х] 0 к= 5х дх

туру на всем X. Не вступая в противоречие с этим обстоятельством и в силу необходимости, мы воспользуемся понятиями и конструкциями риманова пространства. То есть во всех случаях, когда это необходимо, будет предполагаться, что отображение Е непрерывно дифференцируемо нужное число раз (не на всем X, а в некоторых окрестностях точек и кривых).

Всюду в дальнейшем: х* - неизвестное решение уравнения Е(х) = 0 ; хк (хк Ф х*) - очередное приближение к х*; Ук = Е(хк); || • 11, | • | - норма и евклидова длина в Яп , определенные скалярным произведением, действующим на векторах стандартного базиса по правилу (е1, е■ ) =

(- символ Кронекера); | • |^ - длина в смысле римановой метрики [3]; I - прямая в У, состоящая из множества точек вида у = (1 -1) Ук (0 < t < а < 1) , которую будем называть идущей из точки Ук в 0; I* - геодезическая линия в X в смысле римановой метрики, идущая из хк в х*, моделирующая прямую I (в частности Е (I* ) = I, |/* = |/|).

Естественный вопрос - почему бы не попробовать двигаться из хк в х* по кривой I*, которая является прямейшей в римановом смысле?

Уравнения геодезических в натуральной параметризации (а также в любой другой параметризации, пропорциональной натуральной) суть уравнения х' =-Т'^кхс]хк (' = 1,2,...,п) [3] (точки над символом обозначают дифференцирование по параметру, буква для обозначения которого

опущена, Гд - коэффициенты связности и по повторяющимся индексам предполагается суммирование). Так как уравнения 2-го порядка, то для их интегрирования (хоть аналитического, хоть численного) требуется знать не только начальное положение, но и, например, начальный вектор скорости, причем, направленный вдоль геодезической от хк к х*. Очевидно, что таковым, готовым к применению является вектор ak =[Е (хк)] "Ч^к) = -[Е(хк)] 1 Уk =-[Е(хк)] 1 Е(хк) (ибо, так как вектор -ук, как вектор касательного пространства ТукУ, является касательным к

прямой I в точке ук и направлен от ук к 0, то линейным отображением [Е(хк)] -1: V ® V он переводится в вектор, касательный к кривой I* в точке хк и направленный вдоль I* от хк к х*).

Вектор ак есть в точности вектор смещения из точки хк в точку хк+1 в методе Ньютона (1). И мы тем самым обнаруживаем, что шаг по методу Ньютона (1) - это прямолинейный шаг по касательной к геодезической линии I* из точки хк на всю длину вектора ак .

О величине шага. Очевидно, имеют место быть равенства |а к = |-Ук | = |/| = \1* = |\Е(хк )||, из

которых следует, что метод Ньютона пытается одним прямолинейным шагом по касательной к линии I* преодолеть всю ее (риманову) длину, равную ||Е(хк) ||, целиком. Нетрудно видеть, что

настрой на такой «прыжок» наследуется из евклидова пространства У. Ив общем случае он слишком велик. Совершенно очевидно, что в этом кроется одна из причин зачастую быстрой потери сходимости метода при удалении начального приближения от искомого решения.

Обращая теперь внимание на тот факт, что векторное поле а( х) = -[[Е (х) ] 1Е (х) в каждой точке х направлено по касательной к геодезической I*, проходящей через точку х, замечаем, что эти линии являются интегральными кривыми поля а(х). То есть они с аналитической точки зрения являются решениями автономной системы дифференциальных уравнений первого порядка:

х = -[Е (х)]1 Е (х). (2)

Соответственно, точки х* являются стационарными решениями этой системы.

В общем случае решения системы (2) не являются решениями уравнений для геодезических (из-за различия в параметризациях). Причем если линии I* как решения уравнений для геодезических всегда определены на конечных промежутках изменения параметра, то те же линии как решения системы (2) могут быть определены как на конечных, так и на бесконечных промежутках.

Если х (t) - решение системы (2) с начальным условием х (0) = х0 и у (t) = Е (х (t)), то так

как у () = (х())=[ЭЕ (х()) х() = -Е(х()) = -у () , то у (t) = у0е- - прямая в У, идущая

из точки у0 = у (0) = Е (х (0 )) = Е (х0 ) в ноль. В частности, отсюда следует, что для любых двух точек, соединяемых линией х = х (t), она является кратчайшей. То есть она является экстремалью функционала длины [3], и, как говорят в таком случае ([4, с. 199]), с точностью до перепарамет-ризации является геодезической. В дальнейшем слова «с точностью до перепараметризации» будут опускаться.

Если рассматривать линии I* в натуральной (в римановом смысле) параметризации, то векторное поле, порождающее их должно иметь риманову длину 1. Очевидно, что таковым является поле а(х) = |а(х)|^ а(х) = ||Е(х)|| -1а(х) = -||Е(х)|| 1 [[Е(х)] 1Е(х). То есть в этой параметризации линии I* являются интегральными кривыми автономной системы уравнений

х = -|| Е (х)||-1 [Е (х)]-1 Е (х). (3)

2. К вопросу о локальной сходимости

Нетрудно догадаться, учитывая выбор направления движения по линиям I*, что решения х* уравнения ¥(х ) = 0 должны быть устойчивыми узлами системы уравнений (2).

Теорема. Пусть функция Е (х) дважды непрерывно дифференцируема хотя бы в некоторой окрестности решения х* уравнения Е(х) = 0 и линейное отображение ЭЕ(х*) не вырождено. Тогда х* является асимптотически устойчивым узлом системы уравнений (2).

Доказательство. Так как отображение ЭЕ (х*) не вырождено, то по теореме об обратном отображении [5] Е(х) является локальным диффеоморфизмом. Пусть х (х Ф х*) - произвольная точка окрестности, в которой диффеоморфизм реализуется, и у = ¥(х). Прямую I, идущую из у в 0, можно задать параметрическими уравнениями у = у - ty (0 < t < 1). Кривая I* = Е_1(/) является гладкой кривой, идущей из х в х* , определяемой параметрическими уравнениями х(^ = Е_1(у - ty), и |/* |^ = Ц . Для любой другой кривой I**, идущей из х в х*, имеющей конечную риманову длину, ее образ Е(/**) является кривой, имеющей конечную евклидову длину, идущей из у в 0. Так как |/** = |Е(/**)| > |/| = |/* , то кривая /* является геодезической и, следо-

вательно, в некоторой параметризации является интегральной кривой системы уравнений (2). Непосредственно проверяется, что таковой является параметризация т, которая связана с ^параметризацией монотонной зависимостью т = - 1п(1 -1) ^ t = 1 - е~т, ге[0 ; +<х>) ^ t е [0;1) . По

теореме существования и единственности решения [6] это единственная интегральная кривая системы (2), выходящая из точки х. Так как т — +<х> ^ t — 1 - 0, то по определению и по непрерывности имеем Нш х ((т))= Нш х (t) = Нш Е_1 (у - ty) = Е_1 ( Нш (у - ty)) = Е_1(0) = х*. т—’’ г®1-0 4 ’ г®1-0 4 ’ \г®1-0ч ')

Теорема доказана.

Если х(5) - решение системы (3) с начальным условием х(0) = х, где х - точка из доказательства теоремы, то Игл) х (5)= х*. То есть в условиях доказанной теоремы х* является изолированной точкой притяжения для системы (3) (не в смысле устойчивости по Ляпунову).

Из доказанной теоремы непосредственно вытекает общая теорема о локальной сходимости.

Теорема. Если хотя бы в некоторой окрестности решения уравнения Е(х) = 0 итерационная схема аппроксимирует систему уравнений (2) или (3) и вычислительно устойчива, то определяемый ею итерационный процесс является локально сходящимся.

Отметим, в частности, что если аппроксимирующий характер метода Ньютона (1) для системы (2) внешне не угадывается, то для системы (3) он легко устанавливается.

Легко также видеть, что для упрощенного метода Ньютона хк+1 = хк -[Е(х0) ] 1Е(хк) аналогом уравнения (2) является уравнение х = —[Е(х0)] 1Е(х), имеют место аналогичные теоремы, причем от функции Е (х) достаточно потребовать, чтобы она была непрерывно дифференцируемой или была непрерывной и удовлетворяющей условию Липшица.

3. К вопросу о глобальной сходимости

Можно показать, что излагаемая ниже картина справедлива и в том случае, когда отображение Е лишь непрерывно дифференцируемо (не обязательно на всем X). При этом интегральные кривые системы (2) будут геодезическими I*, как стационарные кривые функционала длины [3].

Реальная картина такова.

Вся область X, за исключением подмножеств особых точек, покрывается непродолжаемыми интегральными кривыми уравнения (2) с соответствующим направлением движения по ним, определяемым векторным полем а(х). Эти кривые являются (направленными) геодезическими I* в римановой метрике.

Для всякого решения х* исходного уравнения Е(х) = 0 можно определить область сходимости к нему по геодезическим, как множество всех таких точек в X, для которых существуют проходящие через них линии I*, идущие в х* и достигающие х*. Области, состоящие из точек, лежащих на линиях I*, которые ведут в решения х*, но не достигают их, можно соответственно

назвать областями несходимости. Подмножества особых точек являются “перегородками” между указанными областями двух типов.

Для всякой точки области сходимости по геодезическим к решению х* , рассматриваемой как начальное приближение к х* , можно добиться сходимости из нее к х* . В крайнем случае, - движением мелкими шагами по одной геодезической. Представляется, что в рамках ньютоновской методологии это, по сути, пока единственная стратегия (в контексте задачи глобальной сходимости), гарантирующая положительный конечный результат.

Перспективу попадания из точек областей несходимости в какое-либо решение х* можно охарактеризовать словами “как повезет”. Эксперименты показывают, что, как правило, не везет. Вопрос о том, как узнать для конкретной точки, попадает ли она в какую-либо область сходимости по геодезическим или нет, остается открытым.

О существовании решения исходного уравнения Е(х) = 0 . Во-первых, существование решения может следовать из физических соображений. Во-вторых, если таких соображений нет, то в распоряжении имеется известное векторное поле а( х) системы уравнений (2), которое указывает

решения х* (оно, образно говоря, отовсюду в области сходимости по геодезическим “течет” в одну точку). В двухмерном и трехмерном случаях все особенности портрета интегральных кривых созерцаемы непосредственно.

4. Характеризация метода Ньютона и его модификаций и еще о проблеме сходимости

Выше была установлена геометрическая картина итерационных шагов поиска х* по методу Ньютона, которая заключается в следующем. Из точки хк по касательной к I* делается прямолинейный шаг на всю (евклидову) длину вектора ак =-[Е (хк)] 1Е (хк). Поскольку \ак = |/* =||Е(хк)||, то в римановом смысле длина этого шага равна (римановой) длине ли-

нии I*, которая есть ||Е(хк) ||. Следующее приближение хк+1 является концевой точкой вектора ак , отложенного соответственно от хк . Из точки хк+1 (если она не вылетела из области сходимости в область несходимости) выходит своя линия I*, идущая в решение х* (которое уже может быть не тем же самым, что и для точки хк , если произошел перескок в другую область сходимости). Далее итерационная процедура повторяется из хк+1 и т. д.

Представляется, что такая картина итерационных шагов является характерной для метода Ньютона и его модификаций (методов ньютоновского типа). То есть общий геометрический смысл их состоит в том, что делается шаг по направлению «вдоль» геодезической и он имеет как евклидову, так и определенную риманову длину. При этом передвижение “вдоль” геодезической будет буквальным, если величина шага мала. Если она не мала, то возникают отклонения, причем каждая модификация имеет свое собственное специфическое отклонение, обусловленное поведением геодезической в данной точке.

Сделанный вывод подтверждается двумя обстоятельствами: 1) методы ньютоновского типа имеют одну и ту же методологическую природу (в частности, метод Ньютона (1) является главной линейной частью итерационного шага); 2) метод Ньютона и его модификации обеспечивают сходимость к решению х* уравнения Е (х) = 0 только в том случае, когда начальные приближения достаточно близки к х* [1]. Объясним, почему второе обстоятельство является подтверждающим, а также выясним его природу.

Точка хк может находиться в непосредственной близости от неизвестного решения х* . Линия I* может иметь в хк большую евклидову скорость ак и в то же время (в евклидовом смысле) проходит мимо х*. Пройдя мимо, кривая I* в какой-то момент, и будучи (в принципе как угодно) далеко от х* , начнет разворачиваться, развернется и направится либо уже непосредственно в х* , либо перед этим еще попетляет. Из-за большой скорости полный шаг по методу Ньютона из точки хк (для полноты которого, как мы скоро увидим, имеются как бы все основания) приводит к явлению, которое на практике получило общее название «прострел» [1]. То есть, образно говоря,

вектор ак «пробрасывает» точку хк+1 мимо х* в даль (хотя для потери сходимости хватает, как правило, и не очень далеко), из которой итерации уже никогда не вернутся обратно.

С другой стороны. Так как точка хк находится в непосредственной близости от х*, то величина || Е(хк) || может быть достаточно малой и в силу этого сигнализирующей о том, что искомое решение х* где-то близко. То есть для достижения цели имеются все основания сделать решительно полный ньютоновский шаг ак !!!

Отметим также следующее. Из-за наличия в непосредственной близости от х* точек «про-стрельного» типа шаровая область сходимости (с центром в х* ) может оказаться очень малой (в принципе, сколь угодно малой). В то же время реальная область сходимости может быть заметно большего размера, но по своей конфигурации сильно отличающейся от шаровой. Этот факт (экспериментально проверенный) является теоретическим объяснением давно сделанного на практике вывода о том, что классические результаты, в том числе свежие, о сходимости метода Ньютона [7 - 10] имеют преимущественным образом лишь теоретическое значение.

Аналогично обстоят дела и для модификаций метода. Как уже отмечалось, каждая модификация имеет на итерационном шаге свое собственное специфическое отклонение от геодезической, обусловленное ее поведением. То есть для каждой модификации есть благоприятные точки, из которых шаг делается как бы по направлению к решению, и есть неблагоприятные точки, из которых шаг делается совсем в другом направлении (итерации расходятся). Причем последние точки могут быть сколь угодно близки к искомому решению. Вопрос о том, как узнать для конкретной точки, благоприятна она или нет, остается открытым. Вытекающая из этого непредсказуемость итерационного шага с точки зрения дальнейшей перспективы есть еще одна характерная черта методов ньютоновского типа.

Отсутствие глобальной сходимости у методов ньютоновского типа считается одним из недостатков [2]. Теперь же видно, что это не недостаток, а их естественное свойство.

Легко объясняется и большая локальная скорость сходимости, которая на практике зачастую выше, нежели устанавливаемая теорией. Вблизи от х* линии I* мало отличаются от прямых, равенство римановых длин ак и I* влечет с пренебрежимой погрешностью равенство их евклидовых длин. Ньютоновский шаг практически становится шагом прямо в х*.

Итак, можно сделать вывод, что проблема сходимости в рамках ньютоновской методологии (хоть локальной, хоть глобальной) напрямую связана с геометрической структурой интегральных кривых уравнения (2) и динамикой движения по ним.

Краткое объяснение природы больших евклидовых скоростей движения по линиям I* таково. Если для некоторого участка прямой I, имеющего небольшую длину, его прообраз на I* напротив сильно растянут в евклидовом смысле (а это растяжение, в принципе, может быть сколь угодно большим), то на таком участке кривой I* и будет большая скорость движения.

Проблема глобальной сходимости с геометрической точки зрения - это проблема ориентации, проблема обнаружения направления местоположения искомого решения. Соответственно в практическом плане - это проблема геометрически осмысленного выбора величины и направления шага (в частности, отхода в нужный момент от направления движения вдоль геодезической). Проблема очень непростая, поскольку имеет не локальный характер.

5. Модификация метода Ньютона и некоторые общие замечания

Системой уравнений (2) можно воспользоваться для модификации метода Ньютона (1) в сторону повышения его порядка аппроксимации и соответственно увеличения скорости сходимости за счет дополнительных поправочных членов высших порядков малости. Поправку второго порядка малости можно получить также исходя непосредственно из уравнений для геодезических.

Пусть х(}) - параметрические уравнения линии I* как интегральной кривой системы уравнений (2) с начальным условием х(0) = хк, х(5) - параметрические уравнения I* в натуральной (в римановом смысле) параметризации как интегральной кривой системы уравнений (3) с начальным условием х(0) = хк . И пусть параметры t и 5 отвечают одной и той же точке х(^ = х(5) .

Нетрудно вывести локальную связь t = 5|| Е(хк )|| 1. Так как 5 есть риманова длина участка геоде-

зической I* от хк до х(5), а |Е(хк)|| = |/* , то полученная связь означает, что параметр t опреде-

ляет долю натурального параметра 5 относительно римановой длины кривой I*.

Разложение функции х(5) в ряд Тейлора в окрестности точки хк с условием х(0) = хк, как

II II -1 2 и II -2

показывают вычисления, имеет вид х(5) = хк + ак5||Е(хк) + 0,5 Ьк5 Е(хк ) +..., где

Ь'к = -Г—(хк)а1ка- , (а\,...,аП)Т - компоненты вектора ак =-[[Е(хк)] 1Е(хк), а коэффициенты

И ( ) 52Е Г 8Е О

связности 1— (хк) вычисляются непосредственно по определению —и—- = 1——-. Оставляя в

8х 8х 8х

этом разложении справа первые три слагаемых, полагая х(5) = хк+1, учитывая связь между t и 5 и добавляя управляющие параметры ак, Рк , получим формулу

хк+1 = хк + ак ак* + 0,5 ркЬк1:2, (4)

которая представляет собой модифицированный метод Ньютона, имеющий (при ак = Рк = 1) третий порядок аппроксимации. Параметр t (0 < t < 1) определяет длину итерационного шага от хк до хк+1 относительно римановой длины геодезической I*. При t = 1 - шаг на всю длину, при t = 0,5 - шаг на полдлины и т. д. Параметры а к и Рк предназначены для дополнительной корректировки шага и, в первую очередь, его направления.

Если в формуле (4) оставить только линейную часть приращения (положить ак = 1, Рк = 0), то, как и должно быть, получится формула численного интегрирования системы уравнений (2)

явным методом Эйлера хк+1 = хк + tak = хк -1[Е(хк)] 1Е(хк). Формально заменяя букву t на со к, получим формулу наиболее простой известной модификации метода Ньютона, позволяющей реализовать на итерационном шаге требование уменьшения нормы 0|| < |^(хк^Ц [1, с. 185].

Следует отметить, что такое требование в общем случае недостаточно для сходимости итераций к какому-либо решению. Так происходит, например, при движении по одной геодезической I*, которая не достигает решение (модельный пример, рис. 5). Геометрический смысл параметра Ок ясен, и стандартный метод Ньютона (1) получается, как и должно быть, при значении t = о к = 1.

6. Модельный пример

В качестве модельного примера рассматривалась задача решения системы двух нелинейных уравнений

/1( х) =

Система является симметричной относительно координатных осей и начала координат. Решений четыре - по одному в каждой координатной четверти. В первой координатной четверти

1 2 решение есть точка с координатами х* = 4,24559788..., х* = 1,59014638....

Результаты численных экспериментов представлены на рис. 1-7.

На рис. 1 приведено поле направлений вектора а( х) для первой и четвертой координатных четвертей. Хорошо просматривается наличие двух точек притяжения, областей отталкивания и притяжения на координатных осях. Например, на оси Ох1 интервалы ОС, ББ - области отталкивания, отрезок СБ и луч от Б вправо - притягивающие множества.

На рис. 2 приведен портрет интегральных кривых системы уравнений (2) (геодезических линий I*). Интегральные кривые строились численно с использованием метода (4), который за счет повышенного порядка аппроксимации позволяет использовать более крупный шаг с сохранением достаточной гладкости. Направление движения по кривым указано стрелками. Область сходимости по геодезическим для решения в первой четверти имеет границей контур АББР. Все остальное пространство в первой четверти относится к областям несходимости. Переходы ньютоновских итераций, в том числе с регулируемой величиной шага, из областей несходимости в области сходимости не получаются. Для метода (4) такие переходы возможны (рис. 5).

х х

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+

7 2

-1 = 0, ЛМ =

6,5

2,1

-1

• ехр,

6,5

2,1

= 0

На рис. 3 приведены типичные примеры «прострелов» метода Ньютона для двух начальных приближений, причем точки х1 «вылетают» за пределы области сходимости к х* по геодезическим. Хорошо видно, что ньютоновский шаг делается по касательной к линии I*.

На рис. 4 приведена довольно интересная картина поведения последовательных приближений по методу Ньютона (с небольшой релаксацией - уменьшением шага, поскольку при полном шаге расходимость начинается с первой же итерации). Итерационный процесс как бы пытается, образно выражаясь, зацепиться за решение, но это ему не удается. Для сравнения приведены итерации х^х2,... по методу (4) при значениях ак = Рк = ґ = 1, которые сходятся за 3 шага. Метод (4) в целом имеет более высокую локальную скорость сходимости, чем метод Ньютона (1).

ї ? ? ? 1

, 7 у 1 1 1 Л Л А і, \ \

....... М Ї Т 1 1 ^

> t \ \ \ *)М 4^М1

* > м

«ГІ НЧчччччч

(.СІП>\^'('4'.'(ЧЧЧ4^

і-^ҐІ ШиЧ'іЧЧЧЧ'.чі.

улішншт\\^

*/•»>>>/>!! р * ' " 4 * Іу1 1 1 1 И 1 1 ;//////

ІЧ-ГГГГГГГГГГГСІ.*-^^ ^ ?////♦/♦✓♦ ы.^ьы.ьы.ы.(.ььыч.ьк4-у1#//,Л^^^^1

п гт/г*с і }

/ / /і*/><*<*■*-*-

гГ4\\ЧЧ

ч\ІИ ї 1 І і і і і 4 4 4

4 4 4 4 4 44444444

ХХІ

ч V і ч V і і І і 1 І І і І і і і 4 4 4 4 4 4 4 4

Рис. 1. Поле направлений вектора а(х)

0 1 2 С 3 4 й 6 7 8 Е 9 10 Х1

Рис. 2. Портрет интегральных кривых системы (2)

Рис. 3. «Прострелы»

Рис. 6. Переходы из одной области сходимости по геодезическим в другую

1 □ Е х1

Рис. 7. Сравнение областей сходимости

На рис. 5 приведены последовательные приближения по методу Ньютона из начального приближения, находящегося вне области сходимости по геодезическим (граница области -кривая ББ). Во избежание быстрой расходимости ньютоновский шаг уменьшен в десять раз. Хорошо видно, как последовательные точки, постепенно (и естественно) отклоняясь от геодезической I*, соответствующей начальной точке, приближаются к перегородке из особых точек и после нескольких колебательных движений вверх-вниз вблизи него устремляются высоко вверх. Итерации х^х2,... по методу (4) сходятся (за 7 шагов) при уменьшении полного шага на 32 % (ґ = 0,68, ак = рк = 1).

На рис. 6 приведена ситуация, когда последовательные приближения переходят из одной области сходимости по геодезическим в другую и обратно.

На рис. 7 приведены для сравнения различные области сходимости. Черным цветом закрашена область сходимости метода Ньютона (1). Белая окружность ограничивает шаровую область сходимости, которая устанавливается теорией и практически ничтожна по сравнению с истинной областью сходимости. Область сходимости по геодезическим закраплена и имеет границей контур АБББ. Видим, что в данном примере область сходимости по геодезическим относительно не на много больше области сходимости метода (1).

В заключение отметим, что основные концептуальные моменты, рассмотренные для конечномерного случая, сохраняют свой смысл и для нелинейных операторных уравнений в бесконечномерном случае.

Литература

1. Ортега, Дж. Итерационные методы решения нелинейных систем уравнений со многими неизвестными / Дж. Ортега, В. Рейнболдт. - М.: Мир, 1975. - 558 с.

2. Дэннис, Дж. Численные методы безусловной оптимизации и решения нелинейных уравнений / Дж. Дэннис, Р. Шнабель. - М.: Мир, 1988. - 440 с.

3. Математическая энциклопедия: в 5 т. - М.: Советская энциклопедия, 1984. - Т. 4. - с. 1004.

4. Постников, М.М. Риманова геометрия / М.М. Постников. - М.: Изд. «Факториал», 1998. -495 с.

5. Спивак, М. Математический анализ на многообразиях / М. Спивак. - М.: Мир, 1968. -320 с.

6. Понтрягин, Л.С. Обыкновенные дифференциальные уравнения / Л.С. Понтрягин. - 5 изд. -М.: Наука, 1982. - 332 с.

7. Канторович, Л.В. О методе Ньютона / Л.В. Канторович // Труды мат. ин-та им. В.А. Стеклова. - 1949. - № 28. - С. 104-144.

8. Мысовских, И.П. К вопросу о сходимости метода Ньютона / И.П. Мысовских // Труды мат. ин-та им. В.А. Стеклова. - 1949. - № 28. - С. 145-147.

9. Канторович, Л.В. Принцип мажорант и метод Ньютона / Л.В. Канторович // Докл. АН СССР. - 1951. - Т. 76, № 1. - С. 17-20.

10. Михеев, С.Е. Сходимость метода Ньютона на различных классах функций / С.Е. Михеев // Вычислительные технологии. - 2005. - Т. 10, № 3. - С. 72-86.

Поступила в редакцию 21 февраля 2009 г.

GEOMETRICAL SENSE OF NEWTON METODS

New geometrical sense of Newton methods for solving the system of nonlinear equations (in infinite-measuring case - nonlinear operational equations) found by us, clarifies completely its inner mechanism. From the point of view of application it enables to explain empirically observed effects, to get a unified characterization of the method and its modification, to get a general theorem on the problem of local convergence and to get a quite clear vision of geometrical-dynamic nature of convergence problem on the whole (both local and global). The results obtained are demonstrated on the model example.

Keywords: Newton method, Riemannian geometry, calculus of approximations, differentials equations.

Pchelintsev Mikhail Vasilyevich - Associate Professor, Snezhinsk State Academy of Physics and Technology.

Пчелинцев Михаил Васильевич - доцент, Снежинская государственная физико-техническая академия, г. Снежинск.

e-mail: pchelintsev@sfti.snz.ru

Skorkin Nikolai Andreevich - Dr. Sc. (Engineering), Professor, Branch of the South Ural State University in the city of Snezhinsk.

Скоркин Николай Андреевич - доктор технических наук, профессор, филиал ЮжноУральского государственного университета, г. Снежинск.

e-mail: n.a.scorkin@rambler.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.