Научная статья на тему 'Сходимость метода Ньютона с аппроксимацией обратных матриц процессом Шульца-Зейделя'

Сходимость метода Ньютона с аппроксимацией обратных матриц процессом Шульца-Зейделя Текст научной статьи по специальности «Математика»

CC BY
326
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМА НЕЛИНЕЙНЫХ УРАВНЕНИЙ / МЕТОД НЬЮТОНА-ШУЛЬЦА-ЗЕЙДЕЛЯ / СХОДИМОСТЬ / ОЦЕНКА ПОГРЕШНОСТИ

Аннотация научной статьи по математике, автор научной работы — Вержбицкий Валентин Михайлович, Макурочкина Н. А.

Изучаются условия и скорость сходимости метода решения систем нелинейных конечномерных уравнений, представляющего собой видоизменение метода Ульма-Мозера, основанное на замене в нем итерационного процесса Шульца обращения матриц Якоби его зейделевой модификацией. Предложена теорема сходимости, содержащая один параметр, и следствие, показывающего одну из возможностей фиксировать этот параметр.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Convergence of the Newton method with approximation of inverse matrices by the Schulz-Seidel process

For solving systems of non-linear finite-dimensional equations, a modification of the Newton method is proposed which uses consecutive approximation of inverse matrices by the Schulz-Seidel process. Conditions for a quadratic convergence of this method are specified.

Текст научной работы на тему «Сходимость метода Ньютона с аппроксимацией обратных матриц процессом Шульца-Зейделя»

УДК 519.615.5

© В. М. Вержбицкий, Н. А. Макурочкина

vervm@udm.ru, pulenkov@udm.net

СХОДИМОСТЬ МЕТОДА НЬЮТОНА С АППРОКСИМАЦИЕЙ ОБРАТНЫХ МАТРИЦ ПРОЦЕССОМ ШУЛЬЦА-ЗЕЙДЕЛЯ

Ключевые слова: система нелинейных уравнений, метод Ньютона-Шульца-Зейделя, сходимость, оценка погрешности.

Abstract. For solving systems of non-linear finite-dimensional equations, a modification of the Newton method is proposed which uses consecutive approximation of inverse matrices by the Schulz-Seidel process. Conditions for a quadratic convergence of this method are specified.

Для решения систем нелинейных уравнений

Р (х) = 0, (1)

где Р : М С Мга ^ Мга — дифференцируемая по Фреше векторная

функция векторного аргумента, широко используется метод Ньютона и его различные модификации. В частности, в [1] обоснована квадратичная сходимость метода Ньютона с аппроксимацией обратных матриц по методу Шульца, определяемая формулами

( х(к+1) =х(к) - ЛкР (х(к)), к =0,1, 2,...,

\ Фк =Е - Р,(х(к+1))Лк, Лк+1 =Лк + ЛкФк, (2)

а

где Ао — матрица, близкая к матрице [Р;(х(0))]-1. Там же также в [2] можно найти предложения по модификации итерационного процесса Шульца привлечением к нему идеи, заложенной в

известном методе Зейделя решения систем линейных алгебраических уравнений. Применение процесса Шульца-Зейделя в методе Ньютона трансформирует совокупность формул (2) к виду

I х(к+1) = х(к) - ЛкР(х(к)), к = 0,1, 2,... ,

{фк = Е-Р'(х(к+1))Ак, Ак+1=Ак + АкЩ + Ак+1Щ, ^

где Фк и Фк— результаты аддитивного разложения матрицы-невязки Фк на нижнюю и строго верхнюю треугольные матрицы, соответственно.

Как известно [1, 2], в случае, если обращаемая матрица является верхней треугольной с диагональю, не содержащей нулей, и если в качестве начального приближения берется диагональная матрица с диагональю из обратных величин диагонали исходной матрицы, то итерационный процесс Шульца-Зейделя выдает точную обратную матрицу за один шаг. Следовательно, если матрица Якоби Р;(х) на каждом итерационном шаге метода (3) сохраняет верхнетреугольную структуру и за начальную матрицу Ло принимается матрица [Рх(0)) ]-1, то метод (3) эквивалентен классическому методу Ньютона-Канторовича. Такое заведомо имеет место для систем (1), например, с Р(х) =

(/1(ж1,Ж2,..., Хп); /2(Х2,..., жп);...; /п(жп))Т.

Изучение метода (3) на основе общих теорем сходимости из

[1] (теоремы 9.3, 9.4) по аналогии с получением утверждения о сходимости метода (2) (теорема 9.7 в [1]) приводит к следующему результату.

Т е о р е м а 1. Пусть функция Р(х) определена и дифференцируема в М С Мп, причем 3 Ь > 0 : ||Р;(х) — Р'(х)|| ^ Ь||х — х|| V х, х є М.

Тогда, если вектор х(0) и матрица Ло таковы, что при

некотором Л > 0 выполняются неравенства

||Е - ^/(х(0))ЛоУ < £Л2||^(х(0))||,

г/:= 4ЬЛ2||^(х(0))|К 1 - (4)

Л

и Б := |х € Мга : ||х — х(0) || ^ Л||^(х(0)) || ■ ^ ^2"-1| С М, (5)

то начатый с данных х(0), Л0 метод (3) сходится в Б к решению х* уравнения (1) и имеет место оценка погрешности

II II-- 1_и2к

Доказательство теоремы сводится к построению последовательностей невозрастающих скалярных величин рк, вк, Ък, определяемых при к = 0,1,2,... формулами Рк+1 = 4ЬЛ2р|,

в2

(ро := ||^(х(°))||), Рк = 2‘Р\2рк, Ък+1 = -—^5- (Ьо := ЬХ2р0),

1 вк

и показу того, что они одновременно мажорируют соответственно ||^(х(к))||, ||Фк||, |Е — ^'(х(к))Лк|| и при этом ||Лк|| ^ Л.

Фигурирующее в теореме неравенство (4) можно рассматривать как основное требование, предъявляемое к параметру Л. Чтобы проанализировать это требование, преобразуем неравенство (4) к виду

4£||^(х(0))||Л3 — Л + ЦЛ0Ц < 0. (6)

Соответствующее ему кубическое уравнение всегда имеет вещественный отрицательный корень Л1, не представляющий интереса. Найдя дискриминант, выясняем, что существование других вещественных (заведомо положительных) корней Л2, Лз обеспечивается выполнением условия г] := Ь||Ао||2||-Р(х(-0)) || ^ Наиболее простое выражение этих корней имеет место в случае их совпадения (при г] = ^ ). Подставив соответствующее значение

в вышеприведенную теорему, приходим к следующему утверждению.

С л е д с т в и е 1. Если начальный вектор х(0) и начальная матрица Ао в итерационном процессе (3) таковы, что:

г?:=Ь||Ао||2||^(х(°))|| < ||Е - ^(х(0)) А0|| < ^

и Б(х(0),г) С М,

то справедливо заключение теоремы ( с подстановкой значения Л из (7) и V := 4п в формулы (4) и (5)) .

Другие следствия теоремы, ориентированные на расширение области выбора начальных приближений или на ускорение сходимости (х(к)) к х(*) (аналоги см. в [3], где исследовался метод

(2) применительно к операторным уравнениям в банаховых пространствах) получаются изучением случая, когда имеется отрезок [Л2,Лз] положительных решений рассматриваемого кубического неравенства (6).

Список литературы

1. Вержбицкий В. М. Численные методы (линейная алгебра и нелинейные уравнения). 2-е изд. М.: ОНИКС 21 век, 2005. 432 с.

2. Вержбицкий В. М. Об итерационном процессе Шульца-Зейделя // Алгоритмический анализ неустойчивых задач. Екатеринбург: Изд-во Урал. ун-та, 2004. С. 108-109.

3. Вержбицкий В. М. Выбор параметров в теоремах сходимости одного аппроксимационного аналога метода Ньютона // Журн. вычислит. математики и мат. физики. 1975. Т. 15, № 6. С. 1594-1597.

i Надоели баннеры? Вы всегда можете отключить рекламу.