Научная статья на тему 'Один способ нахождения асимптотического фактора сходимости полношагового итерационного метода для интервальных СЛАУ'

Один способ нахождения асимптотического фактора сходимости полношагового итерационного метода для интервальных СЛАУ Текст научной статьи по специальности «Математика»

CC BY
84
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Ляшко М. А.

Для специального класса интервальных линейных систем х = Ах + b дается нижняя оценка асимптотического фактора сходимости αT полношагового метода х(k+1) = A(k) + b. Показано, что эта оценка почти всегда совпадает с точным значением αT.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Один способ нахождения асимптотического фактора сходимости полношагового итерационного метода для интервальных СЛАУ»

Вычислительные технологии

Том 2, № 1, 1997

ОДИН СПОСОБ НАХОЖДЕНИЯ АСИМПТОТИЧЕСКОГО ФАКТОРА СХОДИМОСТИ ПОЛНОШАГОВОГО ИТЕРАЦИОННОГО МЕТОДА ДЛЯ ИНТЕРВАЛЬНЫХ СЛАУ*

М. А. Ляшко Государственный педагогический институт Балашов, Россия

Для специального класса интервальных линейных систем х = Ах + Ь дается нижняя оценка асимптотического фактора сходимости ат полношагового метода х(к+1) = Ах(к) + Ь. Показано, что эта оценка почти всегда совпадает с точным значением ат.

Основные обозначения

В настоящей статье интервалы и интервальные величины обозначим жирным шрифтом: А, В,... , х, у,... Для других объектов будем использовать следующие обозначения: Ж — множество вещественных интервалов;

X, X — левый и правый конец интервала х соответственно, так что х:=[х, X], х, X € К, X < х;

Кп — множество п-мерных вещественных векторов; 1Кп — множество п-мерных интервальных векторов; Ктхп — множество вещественных тхп-матриц; щтхп — множество интервальных тхп-матриц; |х|:=тах {|х|, |х|} — модуль интервала х;

|А| — вещественная тхп-матрица, составленная из модулей интервальных элементов матрицы А £ 1Ктхп;

д(х, у):=тах {|х-у|, |х-у|} — расстояние между интервалами х и у; если х, у € 1Кп, то под записью д(х, у) подразумевается п-мерный вещественный вектор, компонентами которого являются расстояния между соответствующими интервальными компонентами векторов х и у;

р(А) — спектральный радиус вещественной квадратной матрицы А.

*©М.А. Ляшко, 1997

1. Введение

Рассмотрим систему линейных алгебраических уравнений

x = Ax + b, A e Rnxn, b e Rn,

о которой известно, что элементы матрицы A могут принимать любые значения, принадлежащие соответствующим интервальным элементам матрицы A e IRnxn, а компоненты вектора b — соответствующим интервальным компонентам вектора b e IRn. Возникающее при этом множество систем можно обозначить одной формальной записью

x = Ax + b, A e IRnxn, b e IRn (1)

и назвать "интервальной системой линейных алгебраических уравнений". Предметом исследования в данной работе является скорость сходимости индуцированного системой (1) полношагового итерационного метода

x(0) e IRn,

(2)

x(k+1) = Ax(k) + b, k = 0,1, ...

к интервальному вектору x* = lim^^ x(k), являющемуся неподвижной точкой отображения Ax + b и, следовательно, удовлетворяющему равенству

x* = Ax* + b. (3)

Поскольку при подстановке x* в правую часть уравнения (1) и выполнении всех арифметических операций по правилам классической интервальной арифметики снова получается вектор x*, то при условии сходимости последовательности {x(k)}X=0 интервальный вектор x* является алгебраическим решением системы (1). Для сходимости метода (2) необходимо и достаточно [1], чтобы

P(|A|) < 1.

Итерационную процедуру (2) на множестве IRn интервальных векторов по аналогии с соответствующим итерационным методом в Rn можно отнести к так называемым одноша-говым стационарным методам, которые в общем виде можно записать как

x(k+1) = f (x(k) ), x(0) e IRn, k = 0,1, .... (4)

Скорость сходимости последовательности {x(k)}£=0 к x* = limk^x x(k) оценивается с помощью асимптотического фактора сходимости, являющегося обобщением понятия R1 -множителя (или множителя сходимости по корням) для последовательностей точечных векторов [2].

Определение 1. Пусть x* = f (x*) и пусть G — множество всех последовательностей (x(fc)}^=0; вычисленных по формуле (4) и удовлетворяющих условию limk^x x(k) = x*. Тогда величина

а = sup {limsup ||q(x(k), x*)||1/k | {x(fc)}£°=0 e G}

k=0

k^x

называется асимптотическим фактором сходимости итераций (4) к точке х* (Здесь Ц-Ц — некоторая норма в Rra; а а не зависит от выбранной нормы.)

Хорошо известно [2], что в вещественном случае метод, аналогичный методу (2),

х(0) е Ега,

х(к+1) = Ах(к) + Ь, к = 0,1,..., А е Шпхп, Ь е Ега

n

глобально сходится к решению системы х = Ах + Ь тогда и только тогда, когда р(А) < 1, при этом Я1 = р(А). Для асимптотического же фактора сходимости метода (2), обозначаемого ат, в [1] была доказана только верхняя оценка:

Чтобы доказать равенство в оценке (5), в [1] предлагалось найти начальное приближение

В некоторых конкретных случаях удалось найти вид такого начального приближения, но равенство ат = р(|А|) в общем случае не было доказано. Как показали дальнейшие исследования, это равенство выполняется не всегда. В частности, Г. Майер привел [3] и доказал [4] необходимые и достаточные условия выполнения строгого неравенства ат < р(|А|) для А с неотрицательными интервальными коэффициентами (то есть с а^- > 0, г, ] = 1, п) и неразложимой матрицей |А|. Насколько известно автору, до настоящего времени не получен универсальный способ вычисления ат и асимптотических факторов сходимости других одношаговых стационарных методов. Имеются результаты, касающиеся сравнения факторов сходимости различных методов для упомянутого случая [5] и для других [6], [7], но при достаточно жестких условиях на систему (1).

В настоящей работе указывается способ определения точного значения ат, основывающийся на изучении поведения итерационного процесса (2) в некоторой окрестности решения х* (раздел 2), а затем на основе полученного результата для достаточно широкого класса систем доказывается способ вычисления ат без учета информации о решении, то есть только по виду исходной системы (1) (раздел 3). Предложенный подход может быть распространен на другие интервальные итерационные методы.

2. Вычисление точного значения асимптотического фактора сходимости

Пусть а,х е Ш, а = [а,а], х = [х,X]. Тогда в интервальной арифметике

Рассмотрим случай (назовем его невырожденным),когда левый ax и правый ax концы произведения ax определяются однозначно, то есть когда min(ax, ax, ax, ax) = ax и max (ax, ax, ax, ax) = ax достигаются лишь для одного из четырех значений ax, ax, ax, ax. Совершенно очевидно, что для достаточно близкого к x интервала y = [y, y], в формировании левого конца ay произведения a • y участвует тот же самый конец интервала a (a или a), который формирует и левый конец ax произведения ax. То же самое выполняется и для ay. Исключение могут составить вырожденные случаи, когда ax или ax

ат < P(|A|).

(5)

a • x

[min(ax, ax, ax, ax), max (ax, ax, ax, ax)] = [ax, ax].

достигаются сразу для нескольких из чисел ах, ах, ах, ах. Например, вырожденным будет случай, когда

а =[-0.8, 0.5], х =[-0.1, 0.16].

Здесь

ах = [-0.128, 0.08]; ах = ах = -0.8 ■ (-0.1) = 0.08 или ах = ах = 0.5 ■ 0.16 = 0.08.

Поэтому для достаточно малой величины 8 > 0 имеем

[-0.8, 0.5] ■ [-0.1 - 8, 0.16] = [-0.8 ■ 0.16, -0.8 ■ (-0.1 - 8)]

и

[-0.8,0.5] ■ [-0.1,0.16 + 8] = [-0.8 ■ (0.16 + 8), 0.5 ■ (0.16 + 8)].

Видно, что в данном примере для интервала, достаточно близкого к х, в формировании правого конца произведения а на этот интервал может участвовать как левый, так и правый конец интервала а.

В невырожденном случае произведение интервалов а ■ х можно представить однозначно в виде произведения вещественной 2х2-матрицы и вещественного 2-мерного вектора, первая компонента которого равна х, а вторая — х; компоненты результирующего вектора — соответственно ах и ах:

^ = /ап аМ /

Элементы 2х2-матрицы а^ £ {0, а, а}, г,^ = 1, 2, причем один из элементов каждой строки обязательно равен нулю. Произведение ау того же самого интервала а и достаточно близкого к х интервала у также может быть представлено в виде

ау\ = /ап _ /у ау / 1а21 а2^ 1у

где 2х2-матрица совпадает с матрицей из равенства (6).

Обозначим через Ш(А) множество векторов х £ Шга, таких что в произведениях а^ ■ х.,-элементов матрицы А= (а^)П"^=1 из системы (1) и компонент вектора х= (х^-)™=1 не встречается вырожденных случаев при г,] = 1, п. Далее, пусть в уравнении (3) х* £ Ш(А). Тогда в некоторой окрестности решения х* в процессе формирования левых и правых концов компонент интервального вектора, являющегося очередным приближением в методе (2), будут участвовать соответственно те же самые концы коэффициентов а^, которые формируют и концы компонент решения х*. В этом случае от интервальной п-матрицы А и интервальных п-векторов Ь и х* можно перейти к обычным точечным 2пх2п-матрице А(х*) и 2п-векторам Ь и ж*, которые будут выглядеть следующим образом:

ж* = х^^^ хПхП)Т Ь = (ЬьЬ1,Ь2,Ь2, ЬпЬ„)Т Такая замена соответствует отображению

а: Шга ^ К2га, а(х) = ж = (х1, х1, х2, х2, ... , хп, хп)Т

Коэффициенты а., г,] = 1, 2п, вещественной 2пх2п-матрицы А(х*) определяются с помощью равенства

а(Лх*) = А(х*) ■ а(х*). Поэтому А(х*) удовлетворяет соотношению

ж* = А(х*) ■ ж* + Ь, (7)

что, по существу, является другой записью равенства (3), а для элементов последовательности {х(к)}^=0, порождаемой начальным вектором х(0) из достаточно малой окрестности х* и итерационным процессом (2), выполняются равенства

А(х*) ■ (х^,х^,х2к),х2к), ..., хПк),хПк))Т + Ь =

(х(к+1) Х(к+1) х(к+1) Х(к+1) х(к+1) х(к+1))Т

' ' —п ' п ) '

Для определения структуры матрицы А(х*) выпишем равенство (3) по строкам:

п

х* = ^ а.х* + Ъ*, г = 1, п. (8)

.7 = 1

Из сопоставления (7) и (8) следует, что матрица А(х*) состоит из п2 блоков 2х2. При этом, как видно из равенства (8), г]-й блок 2х2 соответствует распределению концов интервала а.- при умножении на х* для формирования концов х*. Например, при а. < 0 и х* Э 0 г]-й блок 2х2 матрицы А(х*) € Е2пх2п будет иметь вид

0 -|а. |\ /0 а. — |а.1 0 ) \аг. 0

так как в этом случае |а. | = —а. и [а., а.] ■ [х*, х*] = [а. х*, а. х*], откуда

а.7 = /^0 7 . (х*

а.х*) 0 / Vх.?

В работе [8] доказано

Предложение. ат = р(А(х*)).

Как видим, в этом случае для определения ау необходимо найти решение. Гораздо более привлекательной кажется возможность нахождения значения ау по виду исходной системы, то есть только с использованием информации об Л и Ъ. В следующем разделе для некоторого достаточно широкого класса систем строится способ нахождения по виду исходной системы эффективной нижней оценки ау, которая почти всегда является точной.

3. Основной результат

В силу того, что в невырожденном случае левый ах и правый ах концы произведения ах определяются однозначно, выполняются 6 строгих неравенств:

) ах < {ах, ах, ах, ах} \ах,

) ах > {ах, ах, ах, ах} \ах,

< -2 3,

< 1 3,

< 1 7,

> -2 7,

> -2 3,

> 1 3.

где под записью а) подразумеваются 3 строгих неравенства с наименьшим из элементов ах, ах, ах, ах в левой части и с каждым из 3-х оставшихся элементов множества {ах, ах, ах, ах} после удаления из него минимального элемента в правой части. Запись ) истолковывается аналогично. Для неравенств типа (9), получающихся при рассмотрении произведения произвольных интервалов а и х в невырожденном случае, введем краткую запись з(а, х). Например, для а = [-2,1], х = [3, 7] запись з(а, х) обозначает такие неравенства:

-2 -2 -2 1 1 1

Для матрицы А метода (2) выберем произвольный вектор х € Ш(А). Тогда для всех

= 1, п можно записать неравенства s(aij, Xj). Заменяя в каждом из них значение х. на переменную £2.7-1, а х. — на Х2. и объединяя полученные неравенства, получим систему (А, х) из 6п2 линейных неравенств, решением которой является конус П1(х) в К2га (то есть П1(х) С К2га содержит вместе с каждым своим элементом г все элементы вида Лг при любом Л > 0). Заметим, что во множество П1(х) попадают те и только те точки у из К2га, прообразы которых у при отображении а удовлетворяют равенству А(у) = А(х). Далее, заменим во всех неравенствах s(aij, х.) значение х. на выражение а2.-1,к ■ £к + Ь27-1, а х. — на £к=1 а. ■ Хк + Ь2. и снова объединим полученные неравенства в систему. Новую систему 6п2 линейных неравенств с 2п переменными обозначим 52(А, х), а множество ее решений — П2(х). Если П1(х) С П2(х), то обозначим П1(х) = П(х), в противном случае будем считать, что П(х) не существует.

Теорема. Пусть в системе (1) вектор Ь € Ш(А). Если П(Ъ) существует, то аТ > р(А(Ь)). Если к тому же х* € Ш(А), то аТ = р(А(Ь)).

Лемма 1. Если для некоторого у € точка а (у) € П(х), то и а(Ау + Ь) € П(х).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Доказательство леммы 1. Пусть у = а (у) и пусть у € П(х). Тогда у € П1(х) = П(х), то есть А(у) = А(х). Но так как у € П2(х), то А(Ау + Ь) = А(х) и а(Ау + Ь) € П(х).

Применяя эти рассуждения, можно показать, что если для какого-либо х(0) € выполняется включение а (х(0)) € ^(х), то а(Ах(0) + Ь) = а(х(1)) € П(х) и т.д. Таким образом, если для какого-либо х(0) € из метода (2) множество П(х(0)) существует , то П(х(0)) содержит все образы элементов последовательности {х(к)}£=0.

Лемма 2. Если в системе (1) вектор Ь € Ш(А), то либо П(Ь) существует, либо П(х) не существует ни для каких х € Шп. (Иными словами, если для какого-либо х € множество П(х) существует и Ь € Ш(А), то а(Ь) € П(х)).

Доказательство леммы 2. Предположим противное: существует П(х), но Ь = а(Ь) не принадлежит П(х) = П1(х), поэтому Ь не принадлежит и замыканию П(х), поскольку Ь € Ш(А). Следовательно, существует окрестность 0(Ь) точки Ь, не пересекающаяся с П(х). Поскольку А ■ 0 + Ь = Ь и операции интервальной арифметики непрерывны, то существует окрестность 0(0) точки 0, такая что и(0(0)) С О(Ь), где

и(0(0)) = {а(х(1)) | х(1) = Ах(0) + Ь, а(х(0)) € 0(0)} .

Но в 0(0) есть точки из П(х), что противоречит лемме 1.

Заметим, что из доказанной леммы вытекает единственность П(х), то есть П(х) = П(Ь).

Доказательство теоремы. Из леммы 1, свойств х* и определения ат вытекает утверждение: если для какого-либо вектора х £ Ш(А) множество П(х) существует, то ат > р(А(х)). Из леммы 2 следует, что, не теряя общности, в этом утверждении можно положить х = Ь. Чтобы доказать вторую часть теоремы, воспользуемся предположением, что х* € Ш(А). Но тогда из леммы 1 и свойств х* следует, что А(Ь) = А(х*), и заключение теоремы следует из Предложения.

Пример. В системе

1 х* + [1, 2] = х"

Ь € Ш(А) и матрица

3 2

А(Ь)

0

.0

Поэтому в качестве (А, Ь) получим

- 3 ■ X <

- 3 ■ X <

- 3 ■ X <

2 ■ X >

3 ■ х1, 2 ' х1,

■ Х2,

■ Х1,

2 ■ X 2 > з ■ X1,

1

2 ■ Х2 >

■ Х2.

Конус П1(х) в К является множеством решений системы неравенств

X >

х1,

X > —3 ■ Х1.

В качестве 52(А, Ь) получим

1 3 ■ (2 Х2 + 2) < 1 3 ■ (-3 Х2 + 1

1 3 ■ ( 2 Х2 + 2) < 1 2 ^ (-3 Х2 + 1

1 3 ■ ( 2 Х2 + 2) < 1 2 ^ ( 2 Х2 + 2

\ 1 2 ^ ( 2 Х2 + 2) > 1 2 ^ (-3 Х2 + 1

1 2 ^ ( 2 Х2 + 2) > 1 3 ■ (-3 Х2 + 1

1 2 ^ ( 2 Х2 + 2) > 1 3 ■ ( 2 Х2 + 2

Множество П2 (Ь) в К п является множеством решений неравенства х2 > — 5. Следовательно, П(Ь) существует, и имеет место оценка

ат > р(А(Ь)) = 1.

В этом примере ат = р(А(Ь)), поскольку х* = [— 1,4] € Ш(А) (здесь равенство для ат следует также из оценки (5)).

Ясно, что х* € Ш(А) почти всегда. Полученный результат можно усилить: в условии П (х) С П2 (х) вместо П^х) можно взять пересечение П^х) и шара с центром в начале координат и радиусом

|а(Ь)|/(1-р(А(Ь)))

и в качестве П(х) выбрать это пересечение. В данном случае проверка существования П(Ь) легко алгоритмизируется.

Заметим, что если Ь € Ш(А) и П(Ь) существует, то х* = ^(х*) может быть найдено как алгебраическое решение точечной системы

х = А(Ь)х + а(Ь).

Список литературы

[1] АЛЕФЕЛЬД Г., ХЕРЦБЕРГЕР Ю. Введение в интервальные вычисления. Мир, М., 1987.

[2] Ортега Дж., Рейнболдт В. Итерационные методы решения нелинейных систем уравнений со многими неизвестными. Мир, М., 1975.

[3] MAYER G. On the speed of convergence of the total step method in interval computations. In: "Numerical Approximation of Partial Differential Equation" Elsevier Science Publishers B.V., Amsterdam, 1987, 181-189.

[4] Mayer G. On the asymptotic convergence factor of the total step method in interval computation. Lin. Alg. Appl. 85, 1987, 153-164.

[5] MAYER G. On a theorem of Stein-Rosenberg type in interval analysis. Numer. Math. 50, 1986, 17-26.

[6] MAYER G. Comparison theorems for iterative methods based on strong splittings. SIAM J. Numer. Anal. 24, 1987, 215-227.

[7] MAYER G. Enclosing the solutions of systems of linear equations by interval iterative processes. Computing Suppl. 6, 1988, 47-58.

[8] Ляшко М. А. О скорости сходимости полношагового итерационного метода для интервальных СЛАУ. Деп. в ВИНИТИ 08.02.96, №430-В96.

i Надоели баннеры? Вы всегда можете отключить рекламу.