УДК 519.615.5
© В. М. Вержбицкий, Н. А. Макурочкина
[email protected], [email protected]
СХОДИМОСТЬ МЕТОДА НЬЮТОНА С АППРОКСИМАЦИЕЙ ОБРАТНЫХ МАТРИЦ ПРОЦЕССОМ ШУЛЬЦА-ЗЕЙДЕЛЯ
Ключевые слова: система нелинейных уравнений, метод Ньютона-Шульца-Зейделя, сходимость, оценка погрешности.
Abstract. For solving systems of non-linear finite-dimensional equations, a modification of the Newton method is proposed which uses consecutive approximation of inverse matrices by the Schulz-Seidel process. Conditions for a quadratic convergence of this method are specified.
Для решения систем нелинейных уравнений
Р (х) = 0, (1)
где Р : М С Мга ^ Мга — дифференцируемая по Фреше векторная
функция векторного аргумента, широко используется метод Ньютона и его различные модификации. В частности, в [1] обоснована квадратичная сходимость метода Ньютона с аппроксимацией обратных матриц по методу Шульца, определяемая формулами
( х(к+1) =х(к) - ЛкР (х(к)), к =0,1, 2,...,
\ Фк =Е - Р,(х(к+1))Лк, Лк+1 =Лк + ЛкФк, (2)
а
где Ао — матрица, близкая к матрице [Р;(х(0))]-1. Там же также в [2] можно найти предложения по модификации итерационного процесса Шульца привлечением к нему идеи, заложенной в
известном методе Зейделя решения систем линейных алгебраических уравнений. Применение процесса Шульца-Зейделя в методе Ньютона трансформирует совокупность формул (2) к виду
I х(к+1) = х(к) - ЛкР(х(к)), к = 0,1, 2,... ,
{фк = Е-Р'(х(к+1))Ак, Ак+1=Ак + АкЩ + Ак+1Щ, ^
где Фк и Фк— результаты аддитивного разложения матрицы-невязки Фк на нижнюю и строго верхнюю треугольные матрицы, соответственно.
Как известно [1, 2], в случае, если обращаемая матрица является верхней треугольной с диагональю, не содержащей нулей, и если в качестве начального приближения берется диагональная матрица с диагональю из обратных величин диагонали исходной матрицы, то итерационный процесс Шульца-Зейделя выдает точную обратную матрицу за один шаг. Следовательно, если матрица Якоби Р;(х) на каждом итерационном шаге метода (3) сохраняет верхнетреугольную структуру и за начальную матрицу Ло принимается матрица [Рх(0)) ]-1, то метод (3) эквивалентен классическому методу Ньютона-Канторовича. Такое заведомо имеет место для систем (1), например, с Р(х) =
(/1(ж1,Ж2,..., Хп); /2(Х2,..., жп);...; /п(жп))Т.
Изучение метода (3) на основе общих теорем сходимости из
[1] (теоремы 9.3, 9.4) по аналогии с получением утверждения о сходимости метода (2) (теорема 9.7 в [1]) приводит к следующему результату.
Т е о р е м а 1. Пусть функция Р(х) определена и дифференцируема в М С Мп, причем 3 Ь > 0 : ||Р;(х) — Р'(х)|| ^ Ь||х — х|| V х, х є М.
Тогда, если вектор х(0) и матрица Ло таковы, что при
некотором Л > 0 выполняются неравенства
||Е - ^/(х(0))ЛоУ < £Л2||^(х(0))||,
г/:= 4ЬЛ2||^(х(0))|К 1 - (4)
Л
и Б := |х € Мга : ||х — х(0) || ^ Л||^(х(0)) || ■ ^ ^2"-1| С М, (5)
то начатый с данных х(0), Л0 метод (3) сходится в Б к решению х* уравнения (1) и имеет место оценка погрешности
II II-- 1_и2к
Доказательство теоремы сводится к построению последовательностей невозрастающих скалярных величин рк, вк, Ък, определяемых при к = 0,1,2,... формулами Рк+1 = 4ЬЛ2р|,
в2
(ро := ||^(х(°))||), Рк = 2‘Р\2рк, Ък+1 = -—^5- (Ьо := ЬХ2р0),
1 вк
и показу того, что они одновременно мажорируют соответственно ||^(х(к))||, ||Фк||, |Е — ^'(х(к))Лк|| и при этом ||Лк|| ^ Л.
Фигурирующее в теореме неравенство (4) можно рассматривать как основное требование, предъявляемое к параметру Л. Чтобы проанализировать это требование, преобразуем неравенство (4) к виду
4£||^(х(0))||Л3 — Л + ЦЛ0Ц < 0. (6)
Соответствующее ему кубическое уравнение всегда имеет вещественный отрицательный корень Л1, не представляющий интереса. Найдя дискриминант, выясняем, что существование других вещественных (заведомо положительных) корней Л2, Лз обеспечивается выполнением условия г] := Ь||Ао||2||-Р(х(-0)) || ^ Наиболее простое выражение этих корней имеет место в случае их совпадения (при г] = ^ ). Подставив соответствующее значение
в вышеприведенную теорему, приходим к следующему утверждению.
С л е д с т в и е 1. Если начальный вектор х(0) и начальная матрица Ао в итерационном процессе (3) таковы, что:
г?:=Ь||Ао||2||^(х(°))|| < ||Е - ^(х(0)) А0|| < ^
и Б(х(0),г) С М,
то справедливо заключение теоремы ( с подстановкой значения Л из (7) и V := 4п в формулы (4) и (5)) .
Другие следствия теоремы, ориентированные на расширение области выбора начальных приближений или на ускорение сходимости (х(к)) к х(*) (аналоги см. в [3], где исследовался метод
(2) применительно к операторным уравнениям в банаховых пространствах) получаются изучением случая, когда имеется отрезок [Л2,Лз] положительных решений рассматриваемого кубического неравенства (6).
Список литературы
1. Вержбицкий В. М. Численные методы (линейная алгебра и нелинейные уравнения). 2-е изд. М.: ОНИКС 21 век, 2005. 432 с.
2. Вержбицкий В. М. Об итерационном процессе Шульца-Зейделя // Алгоритмический анализ неустойчивых задач. Екатеринбург: Изд-во Урал. ун-та, 2004. С. 108-109.
3. Вержбицкий В. М. Выбор параметров в теоремах сходимости одного аппроксимационного аналога метода Ньютона // Журн. вычислит. математики и мат. физики. 1975. Т. 15, № 6. С. 1594-1597.