Вычислительные технологии
Том 2, № 1, 1997
ОДИН СПОСОБ НАХОЖДЕНИЯ АСИМПТОТИЧЕСКОГО ФАКТОРА СХОДИМОСТИ ПОЛНОШАГОВОГО ИТЕРАЦИОННОГО МЕТОДА ДЛЯ ИНТЕРВАЛЬНЫХ СЛАУ*
М. А. Ляшко Государственный педагогический институт Балашов, Россия
Для специального класса интервальных линейных систем х = Ах + Ь дается нижняя оценка асимптотического фактора сходимости ат полношагового метода х(к+1) = Ах(к) + Ь. Показано, что эта оценка почти всегда совпадает с точным значением ат.
Основные обозначения
В настоящей статье интервалы и интервальные величины обозначим жирным шрифтом: А, В,... , х, у,... Для других объектов будем использовать следующие обозначения: Ж — множество вещественных интервалов;
X, X — левый и правый конец интервала х соответственно, так что х:=[х, X], х, X € К, X < х;
Кп — множество п-мерных вещественных векторов; 1Кп — множество п-мерных интервальных векторов; Ктхп — множество вещественных тхп-матриц; щтхп — множество интервальных тхп-матриц; |х|:=тах {|х|, |х|} — модуль интервала х;
|А| — вещественная тхп-матрица, составленная из модулей интервальных элементов матрицы А £ 1Ктхп;
д(х, у):=тах {|х-у|, |х-у|} — расстояние между интервалами х и у; если х, у € 1Кп, то под записью д(х, у) подразумевается п-мерный вещественный вектор, компонентами которого являются расстояния между соответствующими интервальными компонентами векторов х и у;
р(А) — спектральный радиус вещественной квадратной матрицы А.
*©М.А. Ляшко, 1997
1. Введение
Рассмотрим систему линейных алгебраических уравнений
x = Ax + b, A e Rnxn, b e Rn,
о которой известно, что элементы матрицы A могут принимать любые значения, принадлежащие соответствующим интервальным элементам матрицы A e IRnxn, а компоненты вектора b — соответствующим интервальным компонентам вектора b e IRn. Возникающее при этом множество систем можно обозначить одной формальной записью
x = Ax + b, A e IRnxn, b e IRn (1)
и назвать "интервальной системой линейных алгебраических уравнений". Предметом исследования в данной работе является скорость сходимости индуцированного системой (1) полношагового итерационного метода
x(0) e IRn,
(2)
x(k+1) = Ax(k) + b, k = 0,1, ...
к интервальному вектору x* = lim^^ x(k), являющемуся неподвижной точкой отображения Ax + b и, следовательно, удовлетворяющему равенству
x* = Ax* + b. (3)
Поскольку при подстановке x* в правую часть уравнения (1) и выполнении всех арифметических операций по правилам классической интервальной арифметики снова получается вектор x*, то при условии сходимости последовательности {x(k)}X=0 интервальный вектор x* является алгебраическим решением системы (1). Для сходимости метода (2) необходимо и достаточно [1], чтобы
P(|A|) < 1.
Итерационную процедуру (2) на множестве IRn интервальных векторов по аналогии с соответствующим итерационным методом в Rn можно отнести к так называемым одноша-говым стационарным методам, которые в общем виде можно записать как
x(k+1) = f (x(k) ), x(0) e IRn, k = 0,1, .... (4)
Скорость сходимости последовательности {x(k)}£=0 к x* = limk^x x(k) оценивается с помощью асимптотического фактора сходимости, являющегося обобщением понятия R1 -множителя (или множителя сходимости по корням) для последовательностей точечных векторов [2].
Определение 1. Пусть x* = f (x*) и пусть G — множество всех последовательностей (x(fc)}^=0; вычисленных по формуле (4) и удовлетворяющих условию limk^x x(k) = x*. Тогда величина
а = sup {limsup ||q(x(k), x*)||1/k | {x(fc)}£°=0 e G}
k=0
k^x
называется асимптотическим фактором сходимости итераций (4) к точке х* (Здесь Ц-Ц — некоторая норма в Rra; а а не зависит от выбранной нормы.)
Хорошо известно [2], что в вещественном случае метод, аналогичный методу (2),
х(0) е Ега,
х(к+1) = Ах(к) + Ь, к = 0,1,..., А е Шпхп, Ь е Ега
n
глобально сходится к решению системы х = Ах + Ь тогда и только тогда, когда р(А) < 1, при этом Я1 = р(А). Для асимптотического же фактора сходимости метода (2), обозначаемого ат, в [1] была доказана только верхняя оценка:
Чтобы доказать равенство в оценке (5), в [1] предлагалось найти начальное приближение
В некоторых конкретных случаях удалось найти вид такого начального приближения, но равенство ат = р(|А|) в общем случае не было доказано. Как показали дальнейшие исследования, это равенство выполняется не всегда. В частности, Г. Майер привел [3] и доказал [4] необходимые и достаточные условия выполнения строгого неравенства ат < р(|А|) для А с неотрицательными интервальными коэффициентами (то есть с а^- > 0, г, ] = 1, п) и неразложимой матрицей |А|. Насколько известно автору, до настоящего времени не получен универсальный способ вычисления ат и асимптотических факторов сходимости других одношаговых стационарных методов. Имеются результаты, касающиеся сравнения факторов сходимости различных методов для упомянутого случая [5] и для других [6], [7], но при достаточно жестких условиях на систему (1).
В настоящей работе указывается способ определения точного значения ат, основывающийся на изучении поведения итерационного процесса (2) в некоторой окрестности решения х* (раздел 2), а затем на основе полученного результата для достаточно широкого класса систем доказывается способ вычисления ат без учета информации о решении, то есть только по виду исходной системы (1) (раздел 3). Предложенный подход может быть распространен на другие интервальные итерационные методы.
2. Вычисление точного значения асимптотического фактора сходимости
Пусть а,х е Ш, а = [а,а], х = [х,X]. Тогда в интервальной арифметике
Рассмотрим случай (назовем его невырожденным),когда левый ax и правый ax концы произведения ax определяются однозначно, то есть когда min(ax, ax, ax, ax) = ax и max (ax, ax, ax, ax) = ax достигаются лишь для одного из четырех значений ax, ax, ax, ax. Совершенно очевидно, что для достаточно близкого к x интервала y = [y, y], в формировании левого конца ay произведения a • y участвует тот же самый конец интервала a (a или a), который формирует и левый конец ax произведения ax. То же самое выполняется и для ay. Исключение могут составить вырожденные случаи, когда ax или ax
ат < P(|A|).
(5)
a • x
[min(ax, ax, ax, ax), max (ax, ax, ax, ax)] = [ax, ax].
достигаются сразу для нескольких из чисел ах, ах, ах, ах. Например, вырожденным будет случай, когда
а =[-0.8, 0.5], х =[-0.1, 0.16].
Здесь
ах = [-0.128, 0.08]; ах = ах = -0.8 ■ (-0.1) = 0.08 или ах = ах = 0.5 ■ 0.16 = 0.08.
Поэтому для достаточно малой величины 8 > 0 имеем
[-0.8, 0.5] ■ [-0.1 - 8, 0.16] = [-0.8 ■ 0.16, -0.8 ■ (-0.1 - 8)]
и
[-0.8,0.5] ■ [-0.1,0.16 + 8] = [-0.8 ■ (0.16 + 8), 0.5 ■ (0.16 + 8)].
Видно, что в данном примере для интервала, достаточно близкого к х, в формировании правого конца произведения а на этот интервал может участвовать как левый, так и правый конец интервала а.
В невырожденном случае произведение интервалов а ■ х можно представить однозначно в виде произведения вещественной 2х2-матрицы и вещественного 2-мерного вектора, первая компонента которого равна х, а вторая — х; компоненты результирующего вектора — соответственно ах и ах:
^ = /ап аМ /
Элементы 2х2-матрицы а^ £ {0, а, а}, г,^ = 1, 2, причем один из элементов каждой строки обязательно равен нулю. Произведение ау того же самого интервала а и достаточно близкого к х интервала у также может быть представлено в виде
ау\ = /ап _ /у ау / 1а21 а2^ 1у
где 2х2-матрица совпадает с матрицей из равенства (6).
Обозначим через Ш(А) множество векторов х £ Шга, таких что в произведениях а^ ■ х.,-элементов матрицы А= (а^)П"^=1 из системы (1) и компонент вектора х= (х^-)™=1 не встречается вырожденных случаев при г,] = 1, п. Далее, пусть в уравнении (3) х* £ Ш(А). Тогда в некоторой окрестности решения х* в процессе формирования левых и правых концов компонент интервального вектора, являющегося очередным приближением в методе (2), будут участвовать соответственно те же самые концы коэффициентов а^, которые формируют и концы компонент решения х*. В этом случае от интервальной п-матрицы А и интервальных п-векторов Ь и х* можно перейти к обычным точечным 2пх2п-матрице А(х*) и 2п-векторам Ь и ж*, которые будут выглядеть следующим образом:
ж* = х^^^ хПхП)Т Ь = (ЬьЬ1,Ь2,Ь2, ЬпЬ„)Т Такая замена соответствует отображению
а: Шга ^ К2га, а(х) = ж = (х1, х1, х2, х2, ... , хп, хп)Т
Коэффициенты а., г,] = 1, 2п, вещественной 2пх2п-матрицы А(х*) определяются с помощью равенства
а(Лх*) = А(х*) ■ а(х*). Поэтому А(х*) удовлетворяет соотношению
ж* = А(х*) ■ ж* + Ь, (7)
что, по существу, является другой записью равенства (3), а для элементов последовательности {х(к)}^=0, порождаемой начальным вектором х(0) из достаточно малой окрестности х* и итерационным процессом (2), выполняются равенства
А(х*) ■ (х^,х^,х2к),х2к), ..., хПк),хПк))Т + Ь =
(х(к+1) Х(к+1) х(к+1) Х(к+1) х(к+1) х(к+1))Т
' ' —п ' п ) '
Для определения структуры матрицы А(х*) выпишем равенство (3) по строкам:
п
х* = ^ а.х* + Ъ*, г = 1, п. (8)
.7 = 1
Из сопоставления (7) и (8) следует, что матрица А(х*) состоит из п2 блоков 2х2. При этом, как видно из равенства (8), г]-й блок 2х2 соответствует распределению концов интервала а.- при умножении на х* для формирования концов х*. Например, при а. < 0 и х* Э 0 г]-й блок 2х2 матрицы А(х*) € Е2пх2п будет иметь вид
0 -|а. |\ /0 а. — |а.1 0 ) \аг. 0
так как в этом случае |а. | = —а. и [а., а.] ■ [х*, х*] = [а. х*, а. х*], откуда
а.7 = /^0 7 . (х*
а.х*) 0 / Vх.?
В работе [8] доказано
Предложение. ат = р(А(х*)).
Как видим, в этом случае для определения ау необходимо найти решение. Гораздо более привлекательной кажется возможность нахождения значения ау по виду исходной системы, то есть только с использованием информации об Л и Ъ. В следующем разделе для некоторого достаточно широкого класса систем строится способ нахождения по виду исходной системы эффективной нижней оценки ау, которая почти всегда является точной.
3. Основной результат
В силу того, что в невырожденном случае левый ах и правый ах концы произведения ах определяются однозначно, выполняются 6 строгих неравенств:
) ах < {ах, ах, ах, ах} \ах,
) ах > {ах, ах, ах, ах} \ах,
< -2 3,
< 1 3,
< 1 7,
> -2 7,
> -2 3,
> 1 3.
где под записью а) подразумеваются 3 строгих неравенства с наименьшим из элементов ах, ах, ах, ах в левой части и с каждым из 3-х оставшихся элементов множества {ах, ах, ах, ах} после удаления из него минимального элемента в правой части. Запись ) истолковывается аналогично. Для неравенств типа (9), получающихся при рассмотрении произведения произвольных интервалов а и х в невырожденном случае, введем краткую запись з(а, х). Например, для а = [-2,1], х = [3, 7] запись з(а, х) обозначает такие неравенства:
-2 -2 -2 1 1 1
Для матрицы А метода (2) выберем произвольный вектор х € Ш(А). Тогда для всех
= 1, п можно записать неравенства s(aij, Xj). Заменяя в каждом из них значение х. на переменную £2.7-1, а х. — на Х2. и объединяя полученные неравенства, получим систему (А, х) из 6п2 линейных неравенств, решением которой является конус П1(х) в К2га (то есть П1(х) С К2га содержит вместе с каждым своим элементом г все элементы вида Лг при любом Л > 0). Заметим, что во множество П1(х) попадают те и только те точки у из К2га, прообразы которых у при отображении а удовлетворяют равенству А(у) = А(х). Далее, заменим во всех неравенствах s(aij, х.) значение х. на выражение а2.-1,к ■ £к + Ь27-1, а х. — на £к=1 а. ■ Хк + Ь2. и снова объединим полученные неравенства в систему. Новую систему 6п2 линейных неравенств с 2п переменными обозначим 52(А, х), а множество ее решений — П2(х). Если П1(х) С П2(х), то обозначим П1(х) = П(х), в противном случае будем считать, что П(х) не существует.
Теорема. Пусть в системе (1) вектор Ь € Ш(А). Если П(Ъ) существует, то аТ > р(А(Ь)). Если к тому же х* € Ш(А), то аТ = р(А(Ь)).
Лемма 1. Если для некоторого у € точка а (у) € П(х), то и а(Ау + Ь) € П(х).
Доказательство леммы 1. Пусть у = а (у) и пусть у € П(х). Тогда у € П1(х) = П(х), то есть А(у) = А(х). Но так как у € П2(х), то А(Ау + Ь) = А(х) и а(Ау + Ь) € П(х).
Применяя эти рассуждения, можно показать, что если для какого-либо х(0) € выполняется включение а (х(0)) € ^(х), то а(Ах(0) + Ь) = а(х(1)) € П(х) и т.д. Таким образом, если для какого-либо х(0) € из метода (2) множество П(х(0)) существует , то П(х(0)) содержит все образы элементов последовательности {х(к)}£=0.
Лемма 2. Если в системе (1) вектор Ь € Ш(А), то либо П(Ь) существует, либо П(х) не существует ни для каких х € Шп. (Иными словами, если для какого-либо х € множество П(х) существует и Ь € Ш(А), то а(Ь) € П(х)).
Доказательство леммы 2. Предположим противное: существует П(х), но Ь = а(Ь) не принадлежит П(х) = П1(х), поэтому Ь не принадлежит и замыканию П(х), поскольку Ь € Ш(А). Следовательно, существует окрестность 0(Ь) точки Ь, не пересекающаяся с П(х). Поскольку А ■ 0 + Ь = Ь и операции интервальной арифметики непрерывны, то существует окрестность 0(0) точки 0, такая что и(0(0)) С О(Ь), где
и(0(0)) = {а(х(1)) | х(1) = Ах(0) + Ь, а(х(0)) € 0(0)} .
Но в 0(0) есть точки из П(х), что противоречит лемме 1.
Заметим, что из доказанной леммы вытекает единственность П(х), то есть П(х) = П(Ь).
Доказательство теоремы. Из леммы 1, свойств х* и определения ат вытекает утверждение: если для какого-либо вектора х £ Ш(А) множество П(х) существует, то ат > р(А(х)). Из леммы 2 следует, что, не теряя общности, в этом утверждении можно положить х = Ь. Чтобы доказать вторую часть теоремы, воспользуемся предположением, что х* € Ш(А). Но тогда из леммы 1 и свойств х* следует, что А(Ь) = А(х*), и заключение теоремы следует из Предложения.
Пример. В системе
1 х* + [1, 2] = х"
Ь € Ш(А) и матрица
3 2
А(Ь)
0
.0
Поэтому в качестве (А, Ь) получим
- 3 ■ X <
- 3 ■ X <
- 3 ■ X <
2 ■ X >
3 ■ х1, 2 ' х1,
■ Х2,
■ Х1,
2 ■ X 2 > з ■ X1,
1
2 ■ Х2 >
■ Х2.
Конус П1(х) в К является множеством решений системы неравенств
X >
х1,
X > —3 ■ Х1.
В качестве 52(А, Ь) получим
1 3 ■ (2 Х2 + 2) < 1 3 ■ (-3 Х2 + 1
1 3 ■ ( 2 Х2 + 2) < 1 2 ^ (-3 Х2 + 1
1 3 ■ ( 2 Х2 + 2) < 1 2 ^ ( 2 Х2 + 2
\ 1 2 ^ ( 2 Х2 + 2) > 1 2 ^ (-3 Х2 + 1
1 2 ^ ( 2 Х2 + 2) > 1 3 ■ (-3 Х2 + 1
1 2 ^ ( 2 Х2 + 2) > 1 3 ■ ( 2 Х2 + 2
Множество П2 (Ь) в К п является множеством решений неравенства х2 > — 5. Следовательно, П(Ь) существует, и имеет место оценка
ат > р(А(Ь)) = 1.
В этом примере ат = р(А(Ь)), поскольку х* = [— 1,4] € Ш(А) (здесь равенство для ат следует также из оценки (5)).
Ясно, что х* € Ш(А) почти всегда. Полученный результат можно усилить: в условии П (х) С П2 (х) вместо П^х) можно взять пересечение П^х) и шара с центром в начале координат и радиусом
|а(Ь)|/(1-р(А(Ь)))
и в качестве П(х) выбрать это пересечение. В данном случае проверка существования П(Ь) легко алгоритмизируется.
Заметим, что если Ь € Ш(А) и П(Ь) существует, то х* = ^(х*) может быть найдено как алгебраическое решение точечной системы
х = А(Ь)х + а(Ь).
Список литературы
[1] АЛЕФЕЛЬД Г., ХЕРЦБЕРГЕР Ю. Введение в интервальные вычисления. Мир, М., 1987.
[2] Ортега Дж., Рейнболдт В. Итерационные методы решения нелинейных систем уравнений со многими неизвестными. Мир, М., 1975.
[3] MAYER G. On the speed of convergence of the total step method in interval computations. In: "Numerical Approximation of Partial Differential Equation" Elsevier Science Publishers B.V., Amsterdam, 1987, 181-189.
[4] Mayer G. On the asymptotic convergence factor of the total step method in interval computation. Lin. Alg. Appl. 85, 1987, 153-164.
[5] MAYER G. On a theorem of Stein-Rosenberg type in interval analysis. Numer. Math. 50, 1986, 17-26.
[6] MAYER G. Comparison theorems for iterative methods based on strong splittings. SIAM J. Numer. Anal. 24, 1987, 215-227.
[7] MAYER G. Enclosing the solutions of systems of linear equations by interval iterative processes. Computing Suppl. 6, 1988, 47-58.
[8] Ляшко М. А. О скорости сходимости полношагового итерационного метода для интервальных СЛАУ. Деп. в ВИНИТИ 08.02.96, №430-В96.