Научная статья на тему 'Об условиях оптимальности решения интервальной системы линейных алгебраических уравнений'

Об условиях оптимальности решения интервальной системы линейных алгебраических уравнений Текст научной статьи по специальности «Математика»

CC BY
101
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Ляшко М. А.

Sufficient conditions for the coincidence of the interval hull XH for the combined set Σ of solutions of the interval system x = Ax + b with ρ(|A|) n → IIRn are proved. When x iH iH, a i,j = 0 and a i,j= 0 (i,j=1,n) these conditions also become the necessary ones.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On optimality conditions for the solution of interval linear algebraic systems

Sufficient conditions for the coincidence of the interval hull XH for the combined set Σ of solutions of the interval system x = Ax + b with ρ(|A|) n → IIRn are proved. When x iH iH, a i,j = 0 and a i,j= 0 (i,j=1,n) these conditions also become the necessary ones.

Текст научной работы на тему «Об условиях оптимальности решения интервальной системы линейных алгебраических уравнений»

Вычислительные технологии

Том 9, № 2, 2004

ОБ УСЛОВИЯХ ОПТИМАЛЬНОСТИ РЕШЕНИЯ ИНТЕРВАЛЬНОЙ СИСТЕМЫ ЛИНЕЙНЫХ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ

М.А. Ляшко Балашовский филиал Саратовского государственного университета, Россия e-mail: mail@bf.sgu.ru

Sufficient conditions for the coincidence of the interval hull XH for the combined set £ of solutions of the interval system x = Ax + b with p(|A|) < 1 and the fixed point x* of the mapping Ax + b : IIRra ^ IIRra are proved. When xH < xH, a j = 0 and aj = 0 (i,j=1,n) these conditions also become the necessary ones.

1. Постановка задачи

Для интервальной системы линейных алгебраических уравнений

x = Ax + b, A e HRraxra, b e IIRra, (1)

одной из важных задач является задача нахождения объединенного множества решений (ОМР)

£ = {x|(3A e A)(3b e b)(x = Ax + b)} .

При условии невырожденности всех вещественных матриц, входящих в интервальную матрицу I — A, множество £ ограничено и актуальной является задача нахождения интервального вектора минимальной ширины, содержащего множество £, т. е. так называемой интервальной оболочки XH = , xf,... , множества £, где

xH = [xH,xH] , xf = min{x^|x e £}, xH = max{x^|x e £}, i = l,...,n. (2) В дальнейшем будем предполагать, что £ ограничено, т. е. XH существует. Точные значения min {x^|x e £} и max {x^ |x e £} достигаются при решении систем x = Ax + b, когда значения коэффициентов равны концевым значениям соответствующих интервальных коэффициентов матрицы A и вектора b. Таким образом, решение 2га(га+1) точечных систем гарантирует точное получение XH.

© Институт вычислительных технологий Сибирского отделения Российской академии наук, 2004.

-4

л

4

Х1

-5 -

3

X

4 5

Х1

Рис. 1.

Если в системе (1) р(|А|) < 1 (т.е. отображение Ах + Ь : ПЯ" ^ ПЯ" является сжимающим), то единственный неподвижный интервальный вектор (неподвижная точка) х* этого отображения в силу определения обращающий уравнение (1) в верное равенство

х* = Ах* + Ь

(3)

может быть найден с заданной точностью каким-либо итерационным методом. При этом выполняется включение

Xя С х*.

В некоторых случаях х* совпадает с Xя. Например, система

х

[0.6, 0.8] [ 0, 0.2] [ 0, 0.1] [0.6, 0.8]

х +

[-0.2, 0.2] [-0.2, 0.2]

(4)

имеет ОМР Е, изображенное на рис. 1 слева [3]. Здесь р(|А|) а и х* = Xя

0.94... < 1, вектор х*

([-4, 4], [-3, 3])

Измененная система

х

[ 0.6 , 0.8] [-0.1, 0.2] [-0.12, 0.1] [ 0.6, 0.8]

х +

[-0.2, 0.2] [-0.2, 0.2]

имеет множество Е, изображенное на рис. 1 справа. При этом р(|А|) = 0.95... < 1 и х* = ([-5, 5], [-4, 4])Т , в то время как интервальная оболочка остается прежней: Xя =

([-4, 4], [-3, 3])Т .

Вопрос о совпадении или несовпадении Xя и х* во включении (4) в общем случае до сих пор остается открытым [6]. Основная задача, рассмотренная в этой статье, состоит в следующем: найти условия, при которых неподвижная точка х* отображения Ах + Ь : 11Я" ^ 11Я" совпадает с интервальной оболочкой Xя объединенного множества решений системы х = Ах + Ь. При выполнении этих условий Xя может быть найдена с помощью итерационных методов, достаточно простых в реализации.

2. Основной результат

Приведем доказанные ранее автором [2] как достаточные, так и необходимые условия совпадения Xя и вектора х* для некоторого класса систем (1). Интервал а = [а, а] будем

4

4

считать неотрицательным, если а > 0, и неположительным, если а < 0. Неотрицательным интервалам поставим в соответствие знак " +", а неположительным - знак "-". Интервалу, для которого а = а = 0, можно поставить в соответствие любой знак. Оказывается, некоторой закономерности в распределении знаков интервальных коэффициентов матрицы А достаточно, а при более жестких условиях и необходимо для совпадения х* и Xя, а именно справедлива

Теорема 1 ([2]). Пусть матрица А в системе (1) состоит только из неположительных и неотрицательных коэффициентов. Для того чтобы интервальная оболочка Xя множества Е совпадала с неподвижной точкой х*, отображения Ах + Ь достаточно, а если при г, = 1,п выполняются требования хя < хя и а^ = [0, 0], г = то необходимо, чтобы в матрице А:

1) главная диагональ была неотрицательная;

2) существовало целое число г € {1, 2, ...,п} такое, что если знаки коэффициентов

и а^, р, д = 1,п,р = д, совпадают, то коэффициенты ард и адр неотрицательны, а

если знаки а^р и а^д не совпадают, то коэффициенты ард и адр неположительны.

Например, указанные ниже распределения знаков интервальных коэффициентов в матрице А размера 5 х 5 достаточны для совпадения х* и Xя:

+ + + - - + - + - + + - + + +

+ + + - - - + - + - - + - - -

+ + + - -, + - + - + , + - + + +

- - - + + - + - + - + - + + +

- - - + + + - + - + + - + + +

Не умаляя общности, проверку условий теоремы можно осуществлять с помощью первой строки (г = 1). Процесс легко алгоритмизируется и требует п(п + 1)/2 повторений цикла проверки соответствия знаков коэффициентов (для г = 1,... , п - 1 и ] = г,..., п).

В данной статье результат, сформулированный выше, распространяется на системы, интервальные коэффициенты которых могут содержать нуль внутри. Произведение интервалов в классической интервальной арифметике определяется так, что можно менять один из операндов, не меняя результат. Например, [-1, 2]-[-4, 5] = [-8,10] = [0, 2]-[-4, 5] = [1, 2] • [-4, 5] и т.д. То есть интервал [-1, 2], содержащий 0, дает в этом примере такой же результат, как и положительный интервал [1, 2]. Произвольная матрица А из системы (1) при умножении на вектор из окрестности неподвижной точки х* может давать результат, как если бы она состояла из интервальных коэффициентов фиксированного знака. Это и позволяет сформулировать для таких систем результат, аналогичный изложенному выше.

Рассмотрим а = [-0.8,0.5], х = [-0.1, 0.2]. Тогда ах = [-0.16, 0.1], причем ах = ах = -0.8 • 0.2 = -0.16 и ах = ах = 0.5 • 0.2 = 0.1. Представим полученное произведение в виде

ах\ = (Яи а^ ^ /х^ (5)

ах/ ^21 а22/ \х/ , ( )

где элементы 2 х 2-матрицы а^ € {0, а, а}, г,^ = 1, 2. Получим

'-0.16\ /0 -0.8\ /-0.1

0.1 0 0.5 0.2 (6)

Очевидно, что произведение а• у того же самого интервала а и достаточно близкого к х интервала у также может быть представлено в виде (5), где матрица 2 х 2 совпадает с матрицей из равенства (6):

'ау^ = (0 (у

V0 05У Ы

В другом случае, например при а = [-0.8, 0.5], х = [-0.1, 16], получим произведение ах = [-0.128,0.08]. Здесь ах = ах = ах = 0.08. Поэтому, представляя результат перемножения а и х в виде (5), получим

—0.128Л = ( 0 -0.8\ (-0.Л = (0 —0.8\ (-0.1

0.08 = -0.8 0 0.16 = 0 0.5 0.16

Ясно, что для интервалов, достаточно близких к х, не удастся добиться п(едставления в

виде (5) с одной и той же матрицей 2 х 2: для одних такой матрицей будет ( 0

\ —0.8 0

'0 -0.8'

а для других — матрица I 0 05

Обозначим через Ш(а) множество интервалов х € Ж таких, что произведения ах и ау интервала а и интервала х и достаточно близкого к х интервала у представляются в виде (5) с одинаковой матрицей 2 х 2.

Анализируя возникающие ситуации, можно дать следующее описание множества Ш(а). Пусть а = [а, а], тогда при вырождении а в точку Ш(а) = ПИ. Если же а — знакопостоянный интервал, не вырождающийся в точку, т. е. 0 < а < а или а < а < 0, то Ш(а) состоит из интервалов х, ни один из концов которых не равен нулю. Если же а содержит нуль внутри, т.е. а < 0 < а, то Ш(а) состоит из таких интервалов, для которых ах = ах и ах = ах.

Обозначим через Ш(А) множество векторов х € Ж"" таких, что произведения а^ • Xj и а^ • yj элементов матрицы А = (а^ )".,=1 из системы (1) и компонент вектора х = (xj)"=1 и достаточно близкого к х вектора у = (yj)"=1 представляются в виде (5) с одинаковыми матрицами 2 х 2 при г,^ = 1,п. Далее, пусть в равенстве (3) х* € Ш(А). Поскольку при этом произведения а^х* можно представить в виде (5), интервальную п-матрицу А и интервальные п-векторы Ь и х* можно заменить точечными 2п х 2п-матрицей А(х*) и 2п-векторами Ь и ж*, которые будут выглядеть так:

ж* = Сх1, x1, x2, х" х")Т,Ь = (Ь^ Ь1, Ь2, Ь2,..., Ь" Ь„)Т

Такая замена соответствует отображению

а :11а" ^ Ш2", а(х) := ж = (х1, х1, х2, х2,..., хп, хп)Т (7)

При этом для определения коэффицентов а^, г,^ = 1, 2п, вещественной 2п х 2п-матрицы А(х*) используем равенство

а(Ах*) = А(х*) • а(х*), (8)

которое является обобщением равенства (5). Поэтому А(х*) удовлетворяет равенству

ж* = А(х*) • ж* + Ь,

(9)

которое по существу является другой записью равенства (3). Эта матрица состоит из п2 блоков 2 х 2. При этом г^'-й 2 х 2-блок соответствует распределению концов интервала а^ при умножении на х* для формирования концов х*. Например, для системы

х

[ 0.6 , 0.8] [-0.1, 0.2] [-0.12, 0.1] [ 0.6, 0.8]

х +

[-0.2, 0.2] [-0.2, 0.2]

где х* = ([-5, 5], [-4,4])Т , равенство (9) выглядит так:

- 5 / 0.6 0 0.2 0 - 5 - 0.2

5 0 0.8 0 0.2 5 0.2

- 4 = 0 -0.12 0.6 0 - 4 + - 0.2

V 4 V 0.12 0 0 0.8 V 4 V 0.2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Как показывает анализ всевозможных вариантов, возникающие в формуле (5) 2 х 2-матрицы, а значит, и 2 х 2-блоки в формуле (8) можно разделить на четыре типа:

а)

Р1 0

0 Р2

ь)

0

П2

П1 0

с)

Р1 0

П2 0

й)

0 П1 0 Р2

где рьр2 > 0, п1,п2 < 0, причем в блоках а и Ь элементы могут обращаться в нуль, а блоки с и й обязательно содержат два ненулевых элемента, иначе их можно отнести к блокам типа а или Ь.

Теорема 2. Для того чтобы интервальная оболочка Xя множества Е совпадала с неподвижной точкой х* отображения Ах + Ь достаточно, а если при г,^ = 1,п выполняются требования хя < хя, а^- = 0 и а^ = 0, то и необходимо, чтобы в блочной матрице А(х*):

1) главная диагональ состояла из 2 х 2-блоков типа а;

2) вне главной диагонали не было 2 х 2-блоков, кроме блоков типа а и Ь;

3) существовало целое число г € {1,...,п} такое, что если типы 2 х 2-блоков а^р и , р, д = 1,п, р = д, совпадают, то 2 х 2-блоки ард и адр являются блоками типа а, а если типы а^р и а^ не совпадают, то блоки ард и адр являются блоками типа Ь.

При проверке достаточных условий нулевому 2 х 2-блоку можно приписать любой тип. Таким образом, условия теоремы 2 указывают на то, что для совпадения Xя и х* интервальная матрица А с произвольными по знаку коэффициентами должна вести себя точно так же, как матрица со знакопостоянными коэффициентами, удовлетворяющими условиям теоремы 1.

В основе доказательства необходимости свойств 2 и 3 лежит результат Хансена [4], приводимый ниже. Он касается совпадения или несовпадения концов интервального расширения рациональной функции нескольких переменных и границ множества значений этой функции.

Пусть f (х) : И" ^ И — рациональная функция п переменных. Обозначим х = (ж1,...,жга), а входящие в f(х) постоянные коэффициенты — а = (а1,...,ат). Множеством значений f (х) называется интервал

Ба^е.

ж€х,а€а

f (х) =

тт f (х), тах f (х)

а естественным интервальным 'расширением / (ж) — интервал F(x) = [Е, Е], получающийся в результате замены ж, а соответственно на х, а и всех вещественных арифметических операций на интервальные. Значение Е (Е) называется оптимальным, если Е = шЬхех.аеа/(ж) (Е = шаххех.аеа/(ж)).

Лемма 1 ([4]). Если Е является функцией обоих концов одной или более компонент вектора х, то Е не является оптимальным. То же самое справедливо и для Е. Если Е является функцией только одного конца каждой компоненты вектора х, то Е является оптимальным. То же самое справедливо и для Е.

С помощью результата Хансена докажем важную лемму.

Лемма 2. Если в блочной 2п х 2п-матрице (х*); состоящей из 2 х 2-блоков, для

некоторого к = 2, 3,... существует г?-блок (г,? € {1, 2,... , п}), содержащий в какой-либо

* < ,

строке два ненулевых элемента, и х* < х*, то Xя = х:

Доказательство леммы 2 проведем для к = 2. Пусть ( а(2)) обозначает блочную

матрицу А2(х*). Пусть в матрице А2(х*) блок а(2) (г,? € {1, 2,... , п}) содержит в какой-либо строке два ненулевых элемента. Вектор х* обращает в верное равенство уравнение (1) и уравнение

х = А(Ах + Ь) + Ь, (10)

при этом выполняются равенства (2), включение (4), а ОМР системы (10) совпадает с Е:

Е = {ж|(3А € А)(36 € Ь)(ж = Аж + 6)} = {ж|(3А € А)(36 € Ь)(ж = А(Аж + 6) + 6)} . (11)

Используя (7)-(9), получим

ж* = а(х*) = а (А(Ах* + Ь) + Ь) =

= а (А(Ах* + Ь)) + а(Ь) = А(Ах* + Ь) ■ а(Ах* + Ь) + а(Ь) = = А(х*) ■ (А(х*)а(х*) + а(Ь)) + а(Ь) =

= А2(х*)ж* + А(х*)6 + 6. (12)

Рассмотрим непрерывную вещественную функцию

п

/»(ж) = (А(Аж + 6) + 6)» = ^ а, (Аж + 6),- + 6».

Значением интервального расширения этой функции при замене ж, А, 6 соответственно на х*, А, Ь является интервал х*. Пусть в матрице А2(х*) существует блок а(2), г,? € {1, 2,. . . , п}, содержащий в какой-либо строке два ненулевых элемента. Из соотношения (12) выпишем строки с номерами 2г—1 и 2г:

х* = (А2(х*)ж* + А(х*)6 + 6)2»—1, х* = (А2(х*)ж* + А(х*)6 + 6)2».

В одной из них справа от знака равенства имеются отличные от нуля коэффициенты при х* и х* и по условию х* = х*. В силу непрерывности одна из функций £»(ж) или £»(ж) будет иметь ненулевые коэффициенты при х, и х, для всех векторов, достаточно близких к х*. Поэтому множество значений функции /»(ж)

Кап§ежех* ,Аел,ьеь У»(ж)

шт /(ж), шах /»(ж) хех*,Аел,ьеь жех*,Аел,ьеь

по лемме 1 не совпадает со значением ее интервального расширения, а следовательно, компонента хя, в силу (2) и (11) удовлетворяющая хя С Ка^ех€х» Аельеь/Кх), также не совпадает с х*. Итак, Xя = х*. Рассуждения можно продолжить для к = 3, 4,... □

Доказательство теоремы 2. Докажем необходимость свойства 1 методом "от противного". Пусть на главной диагонали имеется блок 2 х 2 с номером qq типа b, c или d, причем в нем содержится хотя бы один отрицательный коэффициент (n или n2). По условию теоремы Xя = (x^, x^,... , x^)Т , xH = [xH, xH] , xH < xH, i = 1,n. Как уже было сказано выше, координатные компоненты точек из множества решений достигают своих экстремальных значений xH = min {x^|x £ Е} и xH = max {x^|x £ E} в вершинах множества Е, являющихся решениями систем вида x = Ax + b, где aj £ {a^, aj}, bj £ {bi5 b^},

i,j = 1, n. Рассмотрим систему x = A'x + b', решение x' = (xi, x'2, удовлетворяет равенству

Т

которой

xg aqix1 + ■ ■ ■ + aqqxg + ' ' ' + aq«,x«, + bq.

(13)

Аналогично пусть x'' = (x'i, x'2',

^Я,... x^n)Т — решение системы x = A''x + b'', причем

x" = aqi xi + ■ ■ ■ + aq'q x + bq'.

—q

qq—q

""qra^ra

(14)

В матрицах А7 и А" коэффициенты а^ и а^ заменим на адд, обозначив новые матрицы соответственно А7 и А". Подействуем отображением А7х + Ь7 на интервальный вектор

ТТ

'' 12

x

я

.x^) , а отображением A''x + b'' — на вектор (x'/,x'2',...

xH x''

I Aq > • • • 1

Выпишем q-е компоненты векторов, полученных в результате этих отображений:

xq aqix 1 + ■ ■ ■ + aqq xq + ■ ■ ■ + aqnxnn + bq,

xq = aqixi +

+ aqqxH +

+ a'' x'' + b''

+ aqraxra + bq .

В силу монотонности по включению xq С x*, xq' С x(

q

> xH, x'„' < xH, и если хотя бы

x' > ~Я

q, xq >

одно из двух последних неравенств строгое, то xq >

> xq > xH или x* < xq < xq, откуда

q или x^ ^q

xH

я,

[xH, xH] = [x*, x*] и XH = x*. Для доказательства неравенства xq > xH покажем, что

qq q

aqqxH > aqqxH для любого из двух возможных значений a^

qq

qq

aqq или aqq = aqq.

H

ax

В случае же выполнения равенства aqqxqH qq H '' H '' ''

неравенство aqqxH < aq?qxH при aqq = aqq или aqq

' xH

д покажем, что выполняется строгое , из которого следует, что х"

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

H

^ •

Поскольку блок а«« является блоком типа Ь, с или

-ъдд

а„„ < 0 < а«« (0 € т1(адд)). В произведении а«« • х;

н

< 0, и либо а«« < 0, либо

будем иметь

Г1-!-[

3- [

а«д хд

н

а^д хн , а«д хн

, если а«« < 0,

адд Хн ,

, если а«« < 0,

хд > 0.

хд < 0.

а хн а хн

^Ьдд^-д 1 ЪЬдд^д

4. [а«« хн , адд хн

адд хн , ^дд хн

5.[:

к6. [ш1п (

хН ],'

] ,если а«« < 0, 0 € т^хН)-] , если 0 € т^а««), хН > 0. ] , если 0 € 1п1(адд),

а^д х н , адд хн

) шах ( а«дх н ,

хд >

д

хд <

д

■ хН м

ддхд

Н)] , если 0 € т^а««), 0 € Ы;(хН)

Пусть а«

(15)

а«« < 0 и по условию хН < хд . Тогда в указанных в (15) случаях: 1. а«« < 0, а«« < 0,0 < хН < хН, следовательно, а««хН = а„„хН < а„„х Н < а,

««

«г д

.^д^д

хН

< аддхд

адд хН •

2. с!«« < 0, хН < хН < 0, следовательно, а««хН ^д—д

3. а«д < 0, хН < 0 < хН, следовательно, а««хН = а««хН < а««хН

а««хН < а««хН

я

4. а«д < 0 < адд , хд

5. ^дд < 0 < адд, хН

> 0, следовательно, а««хд = а««х;

■л

д

я

я

а«д х Н.

ддхд .

ддхд .

хд < х« < 0, следовательно, а««х^т = а««хН < а««х;

6. адд < 0 < адд, х«

Н < 0 < хН

< а дд х

Н ^ а хН < а х Н дд"д —дд д ^ 2дд—д

я ^ „ ,_я „ ^я

ддхд .

« , следовательно, а««х« < а««х^, а««х«

< ддхд

я

значит,

/ _н _Н ( Н _ _Н

аддхд = ^«дхд < шах (Дддх« , аддх«

ддх

я

дд д

я

д

Таким образом, если а«д = адд < 0 и хН < хН, то а«дхН < аддхН и X Н = х Пусть теперь а«

1. адд < 0,0 < х Н < х Н, и если адд < 0, то а««хН = аддх Н < аддх;

адд = 0 получим а[

дд

х

- х«

дд"д

ТТ _1Т

адд и по условию хН < хд

. Тогда в указанных в (15) случаях: я

дд д

хдд

/ хН = а««хН = а««хН = а««хН. Таким образом, возможно совпадение

дд д

дд д

««—д

ддхд , иначе при

я

/ _Н гг _

ад«хН и аддхН при адд

0. Но в этом случае выполняется строгое неравенство аддхН <

дд д

" х Н

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

дд х«

//

дд

дд д

а«дхН. Действительно, при а«д = а«д получаем аддхН ад« = адд получим, что аддхН < 0 = аддхН = а«дхН.

а«д < 0, адд < 0, хН < хН < 0, следовательно, а««хН

я хН

—«« «

< аддхд

»» Н

а««хН, а при

аддх н < адд хН < аддх

ддх

я

дд д

3. а«« < 0, адд < 0, хН < 0 < хН, следовательно,

^дд "> ^дд — "> ^ ^ " - "д

4. В случае а«« < 0 < а,

ддх

я

0 < хН < хН значения а' х

дд хН = а«« х < 0 / — Н Н

и аддхд совпадают: а««хд

х

дд д / —Н

дд д

аддхН. Покажем, что выполняется строгое неравенство аддхН < а«дхН. Действи-

а«д хН

// Н

тельно, при адд = а«д получаем аддхд

дд д

дд—д

тт

что ддхд

дд ^дд 47 я

а хН < а хН

^дд д

// х ,

дд—д '

//

дд

адд получим,

^«д хд < ^«дх < а«дх«

я

а// х .

адд хд .

5. ^«д < 0 < адд, х<Н < хН

6. Если шах (а«дхд

Н - хН

ддхд

< 0, следовательно, а««х(

Н ^ ^ ^рН _ - хН

ддхд

/ хН — а хН < а

««хд = а«« хд < а«

ддхд

< а«дх

ддх

я

дд д

а«дх« ^ аддх Н , то а«дхН а«дх.

< аддхН = аддхН. Если же

-дд^д

дд д

_ _^

^«д хд , адд хд

а хН

адд хд ,

*

. _н

ТО аддХн

а<?<? ХН

а99хН. Но поскольку а99 < 0 < а^, хЯ < 0 < хЯ, при а^

выполняется

аддхд = ^гдХд > т^П (йддХд , аддХ<н

а

ах .

При а'' = а99 в случае

имеем

Если же

то адд хд = а99 Хд = а99 Хд •

_££ _ ££

а99 хд , адд хд

а хя

аТ' х<? = а99 хн > хд

ах . а99х9 .

т1п хН , а99хН ) = а99хН ,

Допустим, что одновременно

я

я

тах х9 ) х9

а99х9

■я

_^ _ ^

х9 , а99 х9

а<?<? х9

я

их

х*. Следовательно, блок а99 является блоком типа а, что противоречит первоначальному допущению. Необходимость выполнения первого свойства доказана.

Докажем теперь необходимость второго свойства матрицы А(х*) при условии, что хя < и а;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7 я

аг; = 0

= 0, г,^ = 1, п. Это означает, что во всех блоках матрицы А(х*) имеются два ненулевых элемента. Покажем, что наличие в матрице А(х*) вне главной диагонали 2 х 2-блоков вида с или й влечет получение на главной диагонали в матрице А2(х*) 2 х 2-блока, содержащего в какой-либо строке два ненулевых элемента. Пусть блок а^ является блоком вида с или й. При умножении 2 х 2-блоков любого вида на блоки вида с или й с любой стороны получаются только блоки вида с или й. Вычисляя

-,(2)

к=1

... + а,, + ... + а^ а^г +

получим блок с двумя ненулевыми элементами в какой-либо строке, откуда по лемме 2 х* = Xя.

Докажем необходимость третьего свойства матрицы А(х*). Необходимость симметричного расположения блоков одного типа относительно главной диагонали следует из рассуждений, проведенных выше: иначе в А2(х*) будет существовать блок а(2), содержащий два ненулевых коэффициента в какой-либо строке. Допустим далее, что выполняется одно из условий:

1) блоки агР и аг9, р = д, являются блоками типа а, в то время как аР9 и а9Р являются блоками типа Ь, и р = г;

2) блоки агр,аг9, аР9 и а9Р являются блоками типа Ь, и р = д, р = г;

3) блок агр является блоком типа а, аг9 — блоком типа Ь, р = д, а аР9 и а9Р являются блоками типа а, и р = г;

4) блок агР является блоком типа Ь, аг9 — блоком типа а, р = д, а аР9 и а9Р являются блоками типа а, и р = г.

Рассмотрим случай 1. При д = г не выполняется требование симметричного расположения блоков и х* = X я. Пусть г = д. Значит, блок а(2 = ^П=1 а^, содержащий

п

слагаемое агРаР9, будет блоком типа Ь или будет содержать в какой-либо строке два ненулевых элемента. В последнем случае сразу получаем х* = X я. То же самое можно сказать и о блоке а(2 = ^П=1 а^акР, содержащем слагаемое аг9а9Р. Если а(2 и а(2 — блоки типа

Ь, то а(3) = ... + аРг + ... + а^ а9г + ... содержит в какой-либо строке два ненулевых элемента. По лемме 2 получим х* = X я. Остальные случаи рассматриваются аналогично.

Доказательство достаточности, не теряя общности, можно провести для г = 1. Рассмотрим решение х* системы (1) и определим векторы и, V € 1Яп:

,(2),

,(2),

иг

х*, еслиа1г— блок а, х*, еслиа1г — блок Ь,

х*, если а1г — блок а, х*, если а1г — блок Ь.

(16)

Покажем, что при выполнении условий теоремы существуют матрицы А1,А2 € А и векторы Ь1,Ь2 € Ь такие, что и и V являются неподвижными точками отображений А^ж + Ь1 и А2ж + Ь2 и, следовательно, принадлежат Е. То есть равенство х* = Ах* + Ь может быть представлено в виде двух равенств:

и = А1и + Ь1, v = А^ + Ь2,

(17)

где А1, А2 € А, Ь1, Ь2 € Ь. Для определения коэффициентов матриц А1, А2 и векторов Ь1, Ь2 последние соотношения выпишем покомпонентно:

иг

У^ а^-и. + Ь1г, V; = ^ а2г^-и,- + Ь2,, г = 1, 2,..., п. ¿=1 ¿=1

(18)

Равенство (3) можно записать покомпонентно х* = ^П=1 а. ■ х* + Ьг, г = 1, 2,... , п, или

(19)

х*

X] аг.7 ■ х* +

х*

Х^аг. ■ х* + Ьг, г = 1, 2,

, п.

¿=1

¿=1

Поскольку в силу (16) иг и vг являются разными концами х*, для выполнения равенств (18) векторы Ь1,Ь2 € Ь выберем с учетом (19):

Ь1г

Ьг при иг Ьг при иг

Ь2

Ьг при vг Ьг при vг

—*

(20)

В произведении Ах* элементы а. х

*

' аг. х*

1 аг.

аг. х* , аг. х*

(аг. )

11

(аг. )

22

(аг. )

21

(а. ) 0

12

соответствуют блокам А(х*): если а. — блок типа а;

если а. — блок типа Ь.

(21)

Отсюда следует, что при совпадении типов а1Р и а19 (р, д € {1,... , п}, р = д) принадлежность аР9 и а9Р к типу а обеспечивает в равенствах (21) вычисление хР в соответствующем слагаемом только через х*, х* — только через хР, хР — только через х*,

их

только

v

п

п

*

*

}

0

0

0

¿

через хр. Аналогично при несовпадении типов а1р и а1(? (р, д € {1,... , п}, р — д) принадлежность ард и адр к типу Ь обеспечивает в равенствах (21) вычисление хр только через х*, х* — только через хр, хр — только через х*, х* — только через хр. Принадлежность блоков А(х*), расположенных на главной диагонали, к типу а обеспечивает для всех г € {1,... , п} в равенствах (21) вычисление х* только через х*, а х* — только через х*.

Таким образом, при выполнении условий теоремы существуют матрицы А1, А2 € А и векторы Ьь Ь2 € Ь такие, что любой из концов компонент х* в равенстве (21) вычисляется с помощью некоторого определенного фиксированного набора концов остальных компонент и себя самого и любая компонента из этих наборов опять-таки вычисляется через его же компоненты. Эти наборы компонент — векторы и и V.

Зная векторы и и V и решение х*, с помощью равенств (21) можно определить матрицы Аь А2 € А:

а1у —

а2у —

(ау )ц, если и» и аУ — блок типа а

(аг^ )22, если иг -* — х* и аУ — блок типа а

(ау ) 12, если и» и аУ — блок типа Ь,

- )21, если и» —* — х* и — блок типа Ь;

(аг^ )22, если V» -* и аЧ — блок типа а,

(аг^ )ц, если V» * — Хг и аЧ — блок типа а,

(ау )21, если V» -* — х* и аЧ — блок типаЬ,

- (аг^) 12, если V» — х* и аЧ — блок типа Ь.

(22)

Таким образом, доказано, что при выполнении условий теоремы векторы и и V, определенные по формулам (16), удовлетворяют соответственно равенствам и — А1и + Ь1 и V — А^ + Ь2, где векторы Ь1 и Ь2 определены по формулам (20), а матрицы А1 и А2 — по формулам (22). □

Замечание 1. Для проверки требования теоремы хн < хн, г — 1,п, в значительном числе случаев можно использовать эффективную оценку ОМР Е изнутри [5, 7]. Легко показать также, что данное требование будет удовлетворено при выполнении в системе (1) условий Ьг < Ь, г — 1, п. В этом случае Е содержит открытое множество, а значит, ни по одной компоненте X н не вырождается в точку.

П р и м е р 1. Решением системы

х

[-0.1, 0.7 ] [-0.2, 0.08] [-0.2, 0.03] [-0.1, 0.3 ]

х +

[0.1,1.3]

[0.3,1.2]

является вектор х — ([-1, 5], [-1, 2])' . По формуле (8) получим матрицу

А(х*)

0.7 0 0 -0.2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0 0.7 -0.2 0

0 -0.2 0.3 0

-0.2 0 0 0.3

Значит, данная система удовлетворяет достаточным условиям теоремы 2, и Xя = х*. Так как Xя = ([-1, 5], [-1, 2])Т , система удовлетворяет и необходимым условиям. Объединенное множество решений Е, векторы Xя и х* указаны на рис. 2. По формулам (16), (20) и (22) получим

и =(х1, х2) 1 =(-1, 2)

Т

Ь1 = (Ь1, Ь2)Т

(0.1,1.2)

Т

v =(х1, х2)Т = (5,-1)Т,

Ь2 =(Ь1, Ь2)Т

А1

(а11)11 (а21)21

(а12)12 (а22 )22

0.7 -0.2 -0.2 0.3

А

(а11)22 \ (а21) 12

(1.3, 0.3)

(а12)21 (а22)11

Т

0.7 -0.2 -0.2 0.3

Векторы и и v удовлетворяют равенствам и = А1и + Ь1 и v = + Ь2. Как видно из рис. 2, в этих точках обе координаты достигают на Е экстремальных значений.

П р и м е р 2. Система

х

[0, 0.5] [-0.05,0.2] [0, 0.2] [ 0.3 , 0.5]

х +

[ 1.2,2.1] [-0.5, 0 ]

имеет решение х* = ([1, 5], [-1, 2])Т , с помощью которого находим

А(х*)

0 0 0.2 0

0 0.5 0 0.2

0 0 0.5 0

0 0.2 0 0.5

Значит, данная система удовлетворяет достаточным условиям теоремы 2, и X

я

11

121

х*. На

0, и необходимые

рис. 3 изображены Е, Xя и х* для этой системы. Здесь а условия для этого случая не доказывались. Как и в предыдущем примере, можно найти

и = (х1,х2)Т = (1,-1)Т, v = (х,х2)Т

(5, 2)

Т

А

Ь1 = (Ь1, Ь)

(а11)11 (а12)11 (а21) 11 (а22) 11

Т

1>Ы2, -(1.2, -0.5)', Ь2 = (Ь1, Ь2)1 =(2.1, 0)

Т

0 0.2 0 0.5

А

(а11)22 (а12)22 = 0.5 0.2 \(а21 )22 (а22)2^ \0.2 0.5у

В точках и и v обе координаты достигают на Е экстремальных значений. П р и м е р 3. Для системы

х

[ 0.6, 0.7] 0 [-0.3, -0.2] [0.4, 0.5]

х +

[0.4,1.5] [1 , 1.2]

решение х = ([1, 5], [-1, 2]) Т . Находим

А(х*)

( 0.6 0 0 0

0 0.7 0 0

0 -0.3 0.5 0

-0.2 0 0 0.5

В матрице А(х*) будем считать блок а12 блоком типа Ь. Значит, данная система удовлетворяет достаточным условиям теоремы 2, и Xя = х* (рис. 4). Здесь а12 = 0, и необходимые условия не доказывались. Как и в предыдущем примере, можно найти неподвижные точки и и v отображений А1ж + Ь1 и А2ж + Ь2, матрицы А1, А2 и векторы Ь1 и Ь2, задающие эти отображения:

и = (х1, х2)Т = (1, 2)Т, v = (х1, х2)Т = (5, -1)Т, Ь1 = (Ь1, Ь2)Т = (0.4,1.2)Т, Ь2 = (Ь1, Ь2)Т = (1.5,1)Т,

Л =( (а11)11 (а12)1^ = ( 0.6 0 ^ Л =( (а11 )22 (а12)2Л = ( 0.7 0 ^ 1 \(а21 )21 (а22)2^ \-0 2 0.5^' 2 )12 Мц^ ^3 0.5^ "

В точках и и v обе координаты достигают на Е экстремальных значений.

П р и м е р 4. Для системы со знакопостоянными коэффициентами в матрице А

х = /[0.6, 0.7] [-0.2, -0.1]\ х + /[ 0.8, 1.3] х I [0.2,0.3] [ 0.3, 0.4]у х + и-0.8, -0.3]

не выполняются необходимые условия теоремы 2 (и теоремы 1): блоки а12 и а21 будут, очевидно, иметь разные типы, а по замечанию 1 хя < хя, г = 1, 2,..., п. Эта система имеет решение х* = ([1, 5], [-1, 2])Т и ОМР Е, изображенное на рис. 5. Здесь

Xя = ([1.8, 4.3], [-0.6,13])

Т

и Xя = х*. Из рис. 5 видно, что каждая координата достигает экстремального значения в точке множества Е, в которой другая координата экстремума не достигает.

Замечание 2. Если выполнены требования 1-3 теоремы 2 и 0 € т^х*), г = 1,п, то ненулевые коэффициенты в 2 х 2-блоках ау являются наиболее удаленными от нуля концами интервалов ау и вид формул (22) значительно упрощается: г^'-коэффициенты (г, ] = 1, п) матриц А1 и А2 находятся по формулам

!ау, если блоки а1г,ау одного типа,

(23)

ау, если блоки а1г,ау разных типов. В качестве иллюстрации можно рассмотреть пример 1.

Х2

-1-

X

я

х

5 Х1

Рис. 5.

Таким образом, используя теорему 2, вопрос о совпадении или несовпадении Xя и х* для систем общего вида можно решить только после нахождения решения х* и построения матрицы А(х*), но в некоторых случаях при выполнении достаточных условий теоремы 1 матрицы А1 и А2 и векторы Ь1 и Ь2 можно построить, используя только исходную систему (1). Решая вещественные системы (17) прямым или итерационным методом, можно найти границы компонент х*. Именно, справедлива

Теорема 3. Пусть матрица А в системе (1) состоит только из неположительных и неотрицательных коэффициентов, 0 € т^Ъ), г = 1,п, и выполнены требования 1 и 2 теоремы 1. Тогда Xя = х* и концы компонент х* находятся при решении вещественных систем (17), где %-е компоненты (г = 1,п) векторов Ь1 и Ь2 определяются по формулам

Ъ, если а1г > 0, Ъг, если а1г < 0,

ь2г

Ъ,

Ъ,

если а1г < 0, если а1г > 0,

2

1

а г^'-коэффициенты (г,^ = 1,п) матриц А1 и А2 — по формулам (23).

Лемма 3 ([1]). Пусть А — интервальная матрица, для которой р(|А|) < 1. Тогда для решения х* (которое существует и единственно) уравнения х* = Ах* + Ь верно соотношение

Доказательство теоремы 3. Используя лемму 3, получаем, что 0 € т^х*), г = 1,п. В этом случае формулы (24) сразу же получаются из формул (20). После нахождения решений и и v, соответствующих системам (17), концы г-х компонент (г = 1,п) решения х*, очевидно, определяются по формулам

Список литературы

[1] Алефельд Г., Херцбергер Ю. Введение в интервальные вычисления. М.: Мир, 1987.

[2] Ляшко М.А. О совпадении интервальной оболочки объединенного множества решений ИСЛАУ с итерационным решением. Балашов, 1996. Деп. в ВИНИТИ 08.02.96,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[3] BARTH W., Nuding E. Optimale Losung von Intervallgleichungssystemen // Computing. 1994. Vol. 12. P. 117-125.

[4] HANSEN E.R. Sharpness in Interval Computations // Reliable Computing. 1997. Vol. 3, N 1. P. 17-29.

[5] KUPRIYANOVA L. Inner estimation of the united solution set of interval linear algebraic system // Reliable Computing. 1995. Vol. 1, N 1. P. 15-31.

[6] NEUMAIER A. Interval Methods for Systems of Equations // Cambrige: Cambrige Univ. Press, 1990.

[7] ШАРЫй С.П. Алгебраический подход к анализу линейных статических систем с интервальной неопределенностью // Изв. РАН. Теория и системы управления. 1997. № 3.

{y = (I - A)-1b|A е A, b е b} С {ф е x*}.

№ 429-В96.

С. 51-61.

Поступила в редакцию 28 февраля 2002 г., в переработанном виде — 31 июля 2002 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.