Об условиях невырожденности интервальных матриц Ерохин В.И. ([email protected]) Борисоглебский государственный педагогический институт
Получены новые достаточные условия невырожденности интервальных матриц общего вида (задаваемых центральной матрицей и матрицей радиуса), а также необходимые и достаточные условия невырожденности интервальных матриц специального вида, матрица радиуса которых представляет собой произведение скалярного множителя на матрицу, состоящую из единиц. Интервальные матрицы указанного специального вида исследуются в работе более детально. Для них выведены достаточные условия возможности проверки невырожденности за полиномиальное время, построены соответствующие примеры. На модельных интервальных матрицах (невырожденной и вырожденной) проведено исследование ряда известных достаточных условий невырожденности и вырожденности, показавшее, что для всех критериев кроме одного модельные интервальные матрицы указанного специального вида оказались "плохим" случаем. Показано, что критерий достаточных условий невырожденности, оказавшийся исключением, представляет для интервальных матриц указанного специального вида также необходимым и достаточным условием невырожденности. Получена априорная оценка абсолютной погрешности вычисления минимального скалярного множителя в матрице радиуса (обеспечивающего вырожденность интервальной матрицы указанного специального вида), абсолютной погрешностью задания элементов центральной матрицы. Приведен численный пример с плохообусловленной центральной матрицей, демонстрирующий согласованность указанной априорной оценки с результатами расчетов.
Введение
Рассмотрим семейство матриц
^асАа = [Ас - Да, Ас + Дл] = {А е | Ас - ДА < А < Ас + Аа}, (1)
где Ас, Аа £ К™*™, > 0 и знаки "<" и ">" трактуются как знаки поэлементных операций. Объект д , задаваемый формулой (1), в литературе по интервальным вычислениям принято называть интервальной матрицей. При этом Ас называют центральной матрицей, а Д^ - матрицей радиуса. Интервальную матрицу д называют невырожденной (см., например, [8]), если каждая матрица А £ является невырожденной, что эквивалентно, например,
отсутствию нетривиальных решений х £ К™ у однородного уравнения
Ах = 0
В противном случае интервальную матрицу называют вырожденной.
Проверка невырожденности интервальной матрицы является важным этапом в исследовании совместности интервальных систем линейных алгебраических уравнений, построении или оценивании [6] множества их решений. Можно указать и другие задачи, где невырожденность интервальной матрицы необходима. Это, например, задача построения интервальной обратной матрицы [8] или обратная задача для интервальной системы линейных алгебраических уравнений, заключающаяся в оценивании максимально возможных отклонений Д^ и Ab, при которых множество решений системы с интервальной матрицей и интервальной правой частью Ъ[с Дь = [Ьс — Аь,Ьс + А&], где Ъс, Аь £ IRn, А6 > 0, содержится в некотором интервальном векторе х^ д = [хс - АХ} хс + Ах]} где хс, Ах G Rn, Аж > 0 [18].
Наряду с исследованием невырожденности интервальной матрицы А^с общего вида (1) представляет интерес исследование невырожденности интервальной матрицы специального (достаточно простого) вида
A IAciB = [Ac-eE,Ac + eE], (2)
где е £ IR, е > О, Е G IRnXn - матрица, все элементы которой - единицы. Несложно заметить, для всякой А^с найдется такое число е, (которое мы в дальнейшем будем назвать радиусом интервальной матрицы А^с е) что будет справедливо условие А^с С АтАс е.
Как известно, (см., например, [9]), задача проверки невырожденности интервальной матрицы является NP-трудной. В работе [14], посвященной проверке положительной определенности симметричной интервальной матрицы, было показано, что проверка невырожденности интервальной матрицы вида (2) для произвольного рационального е > 0 и некоторой симметричной положительно определенной матрицы с неотрицательными рациональными элементами Ас также является NP-трудной. В связи с этим становится актуальной проблема получения некоторых относительно простых и практичных в вычислительном плане критериев ("verifiable conditions"), способных выполнять роль достаточных условий невырожденности интервальных матриц. Одной из последних работ, посвященных указанной теме, является, по-видимому, работа [11]. Эта работа содержит как обзор классических результатов, так и новейшие результаты, полученные авторами статьи и другими исследователями. Это - четыре формулировки достаточных условий невырожденности и пять формулировок достаточных условий вырожденности интервальных матриц, которые представлены в приведенной ниже таблице 1. Формулировки всех критериев цитируются по статье [11], однако в таблице указаны также ссылки на оригинальные работы. Некоторые результаты были получены независимо разными авторами, ряд ранее известных результатов обоснован авторами работы [11] с использованием другой техники. Мы не приводим здесь всех деталей, за которыми можно обратиться к работе [11].
Таблица 1. Достаточные условия невырожденности и вырожденности матрицы А1
Невырожденность вырожденность
Зйе1"х" (1+\1-АсН\У<(Аа\Н\У
Р(\1-НАс\ + \Н\Аа)<1 [И], [15] (3) (7)
рЦА;1 \Аа)<1, (4) шах {А^А-1^^ > 1, 3 (8)
где Ас - невырожденная матрица [7], [10], [12] где Ас - невырожденная матрица [11], [13]
Лтах(АтлАА) < ЛШШ(АТСАС)[16], [И] (5) шах (ЛаК-Ч^ДаК"1!)^ > 1[11], [17] ч (9)
матрица АТСАС- ЦД^ДаЦ (6) ^тах матрица (АТСАС) < Атт(Д^Дл)[11] (10)
положительно определена, || • || - некоторая подчиненная норма [11] Д^Дл - АТСАС (Н)
положительно полуопределена [11]
Заметим, что и достаточные условия невырожденности, и достаточные условия вырожденности интервальных матриц, приведенные в работе [11], не содержат в явном виде формулы или алгоритма, по которым для некоторой заданной матрицы Ас можно было бы построить соответствующую матрицу Д^ или еЕ так, чтобы интервальная матрица вида (1) или (2) обладала заданным свойством невырожденности или вырожденности. Попытка устранить указанный недостаток и предпринята в настоящей работе. Данная попытка получилась более успешной применительно к интервальным матрицам вида (2) и оказалась возможной благодаря некоторым новым результатам из области матричной коррекции несовместных систем линейных алгебраических уравнений, полученных в работах [1], [2]. Опираясь на указанные результаты и используя опробованную в названных работах технику, основанную главным образом на некоторых полезных свойствах аддитивных матричных норм, удалось получить нижнюю оценку радиуса минимального интервала, допускающего вырожденность интервальной матрицы вида (1). Это, в свою очередь, позволило сформулировать новые достаточные условия невырожденности матриц вида (1), и новые необходимые и достаточные условия невырожденности интервальных матриц вида (2). Более того, удалось указать условия, при которых проверка указанных необходимых и достаточных условий не является МР-трудной. В рамках данных
условий оказалось несложно, в числе прочих возможностей, конструировать разнообразные модельные интервальные матрицы вида (2), обладающие требуемыми свойствами невырожденности или вырожденности. В частности, удалось построить модельные интервальные матрицы, демонстрирующие нераспознаваемость невырожденности и вырожденности некоторыми критериями в форме достаточных условий, а также выявить, что при определенных обстоятельствах один из критериев невырожденности переходит из класса достаточных условий в класс необходимых и достаточных.
Разумеется, наиболее интересным и труднопроверяемым является вопрос о практической ценности для реальных вычислительных задач представленных в настоящей работе результатов. В качестве попытки подойти к ответу на данный вопрос в работе приведен небольшой фрагмент исследования влияния погрешностей в элементах матрицы Ас на точность вычисления минимального радиуса £*, гарантирующего вырожденность интервальной матрицы вида (2). При этом удалось получить априорную оценку для абсолютной погрешности параметра £*, которая достаточно неожиданно оказалась оцениваемой сверху только значением максимальной абсолютной погрешности элемента матрицы Ас (т.е., не зависящей явно от числа обусловленности Ас). Данный результат, полученный путем незначительной модификации классической техники оценивания погрешностей вычисления обратных матриц и решения систем линейных алгебраических уравнений, также подкреплен соответствующим численным примером.
Перед тем, как переходить к изложению основного материала, поясним некоторые обозначения. Так, для матрицы, составленной из абсолютных величин матрицы А = (а^) будем использовать закрепившееся в интервальном анализе обозначение |А| = Опять же в рамках установившихся традиций, запись
вида \х\ будем считать записью вектора, к которому применена поэлементная операция вычисления абсолютной величины. Неравенства вида "<", ">", "<", примененные к матричным и векторным объектам, будем считать поэлементными. Символом р(А) будем обозначать спектральный радиус матрицы А; символами Ат;п(А) и Атах(А) - обозначать соответственно минимальное и максимальное собственное значение симметричной матрицы А. Для вектора, составленного из собственных значений матрицы А будем использовать обозначение eigenvalues(A). Символом / будем обозначать единичную матрицу, символом Е - матрицу, все элементы которой являются единицами. Для элемента с индексами матрицы, задаваемой некоторой формулой, будем использовать обозначение (■■■){г Например, запись {A~l)i:j означает элемент с индексами матрицы А'1. Запись вида (...)■' будет обозначать столбец с номером ] матрицы (...), а запись (,..)г- - соответственно строку с номером г матрицы (...). Символом сопс! А = ||А|| • ||А-11| для невырожденной матрицы А будем обозначать ее число обусловленности, определенное с использованием некоторой подчиненной нормы || • ||.
1. Оценка радиуса минимального интервала, допускающего вырожденность интервальной матрицы
Во введении мы условились называть радиусом интервальной матрицы вида (2) число е. Сейчас настало время обобщить это понятие на случай произвольной интервальной матрицы вида (1). Поскольку для этого необходимо обобщить понятие абсолютной величины на матричный объект Д^, уместно обратиться к матричным нормам.
Определим матричную норму || • соотношением
где А £ IRmXn, х £ IRn, <£>(•) и ф(-) - произвольные векторные нормы (не обязательно нормы Гёльдера) соответственно в IRn и IRm и соотношение между тип произвольное. Заметим, (см., например, [5]), что в общем случае норма || ' ||<р,ф удовлетворяет только аксиомам векторных норм (т.е., не является мультипликативной). Тем не менее, этого достаточно, чтобы определить радиус интервальной матрицы как
г<рА*АсАа) = (13)
Имея определение (13), уместно, например, выяснить, при каком выборе норм <£>(•) и ф(-) выполняется условие
гЧ>АААс,е) = £-
Мы ответим на этот вопрос в следующем параграфе, а сейчас обратим внимание на ряд полезных вспомогательных соотношений. Для дальнейших выкладок потребуется определение векторной нормы <£>*(•), двойственной к заданной векторной норме <£>(•) относительно скалярного произведения:
где ж, у £ IRn - некоторые векторы. Кроме того, потребуется условие
Ч>*(У) ' 4>{х) = УТж = 1, (15)
которое является определением вектора у, двойственного к вектору х относительно нормы <£>(•).
Следует заметить, что объекты, задаваемые формулами (12)-(15), действительно определены корректно и всегда существуют, а использование "max" вместо "sup" оправдано, поскольку соответствующие верхние грани всегда достигаются (см., например, [5]).
Теперь обратимся к приведенной в работе [1] лемме, обобщающей полученное А.Н. Тихоновым [3] минимальное по евклидовой норме решение системы линейных уравнений Ах = Ъ относительно неизвестной матрицы А на случай произвольной нормы || • ||
Лемма 1. Пусть х £ IRn и Ъ £ IRm - произвольные векторы, х ф 0. Тогда система уравнений Ах = Ъ разрешима относительно А и при этом существует решение А из класса одноранговых матриц размера т X п, минимальное по норме || • ||которое дается формулой
А = Ьу\ (16)
где у £ IRn - вектор, двойственный вектору х относительно нормы <£>(•). При этом
Hill., = ff (it>
Предположим теперь, что некоторая матрица Ас £ IRnXn является невырожденной, что эквивалентно отсутствию нетривиальных решений соответствующей однородной системы линейных алгебраических уравнений. Зафиксируем некоторый вектор х £ IRn, х ф 0, и рассмотрим систему линейных алгебраических уравнений
(Ас + Н)х = 0 ^ Нх = -Асх, (18)
где Н = (hij) £ IRnXn - некоторая матрица.
В силу леммы 1 для любого вектора х ф 0 система (18) разрешима относительно матрицы Н, и поэтому, в свою очередь, матрица Ас + Н оказывается вырожденной. Опираясь на формулу (17), оценим нижнюю грань величины Ц-ffllv,^, для матрицы Н, являющейся решением уравнения (18) при соответствующем выборе вектора ж:
• гитти . ф(-Асх) ■ Ф(АСх) ( У?(ж) 4
mi =mi -—— = ml -—— = sup —-—-
хфО Lp{X) хфО Lp{X) \хф0 Ф{АСХ)
( ^(А-Ч)У1 ( ^(А-Ч)У1 = sup— = max— = ( Ac \\фч!) , (19)
Wo ф(и) ) V Ф(и) )
где и £ IRn, и = Acx. Несложно заметить, в цепочке равенств (19) использована абсолютная однородность векторной нормы, невырожденность матрицы Ас (в силу чего существует А"1 и для любого х ф 0 следует, что у = АГх ф 0) и, кроме того, использовано определение (12).
Пусть ЩАС, Н) - множество всех вырожденных матриц вида Ас-\-Н} где Ас £ RnXn - невырожденная матрица. Тогда один из основных результатов данного параграфа может быть сформулирован в виде нижеследующей теоремы.
Теорема 1.
и и\\ . — и
шш \\H\U = \\А:%\. (20)
21(Ас,Н)фШ
При этом существуют такие ненулевые векторы и,х,у £ где у - вектор, двойственный вектору х относительно нормы <р(-), что
х == Ас и, Н = —иут, (Ас + Н) еЩАс), (Ас + Н)х = О,
Доказательство теоремы опирается на лемму 1 (формулы (16) и (17)) и соотношения (18), (19).
Несложно заметить, что теорема 1 в качестве следствия позволяет легко сформулировать достаточные условия невырожденности интервальной матрицы ААс,Ал:
Следствие. Пусть матрица Ас - невырождена и
ГгЛ^Ал) < (21)
Тогда матрица является невырожденной.
Заметим, что конкретный вид условия (21) зависит от вида используемых векторных норм <£>(•) и ф(-), которые в общем случае не обязаны быть нормами Гёльдера. Как конструировать новые векторные нормы из уже существующих, замечательно описано, например, в книге [5]. Некоторые примеры "взвешенных" норм можно найти в работе [1], где они предлагаются в качестве возможных показателей качества матричной коррекции несовместных систем линейных алгебраических уравнений.
2. Необходимые и достаточные условия невырожденности интервальной матрицы А^ £ и возможности их проверки за полиномиальное время
Теорема 1 и следствие позволяют получать разнообразные полезные критерии, если учесть, что в классе || • норм представимы такие известные матричные нормы (см., например, [5]), как
шах
_ \\м
Т^сГ || Ж || 1 Ы
||А*||
шах —-—^— =тах (22)
хфО ЦжЦх
1 = ||А||1=таХ^|а0-|, (23)
тах
хфО ||ж||2
= ||А||2 = Атах(АМ), (24)
max = ЦАЦоо =тах V \аг1\. (25)
хфО ||ж||с
i
Наибольший интерес в контексте данной статьи представляет соотношение (22). С одной стороны, как нетрудно убедиться,
n,oo(A^i£) = е.
С другой стороны, утверждение (20) теоремы 1 принимает вид min ||#||i,oo = min max \hhJ\ = \\A~1\\^1,
так что
минимальный радиус, при котором интервальная матрица вида (2) является вырожденной.
Более того, справедлива следующая
Теорема 2. Для того, чтобы интервальная матрица е с невырожденной матрицей Ас £ IRnXn была невырожденной, необходимо и достаточно, чтобы выполнялось условие
^ll^lKi- (26)
доказательство. Достаточность следует из следствия теоремы 1. Необходимость докажем "от противного". Пусть е > Н^сН^и но матрица е является невырожденной. Тогда, в соответствии с теоремой 1, можно построить матрицу Н такую, что, с одной стороны, матрица (Ас + Н) является вырожденной, а с другой стороны, max \hij\ = H^dl^n откуда следует, что
ы
(Ас + Н) £ Адс е (противоречие). □
К сожалению, в общем случае не существует формул, подобных (22),(23) или (25), связывающих значение || • Цоод нормы с элементами исследуемой матрицы. Не известны в общем случае и алгоритмы, подобные алгоритмам вычисления нормы (24). Более того, учитывая упоминавшийся во введении результат работы [14] он NP-трудности проверки невырожденности интервальной матрицы Аас е с рациональным е > 0 и рациональной неотрицательной симметричной положительно определенной матрицей Ас, можно заключить, что встречаются такие матрицы, для которых вычисление || • Цоод нормы будет NP-трудным.
В то же время, можно показать, что значение || • Цоод нормы не превосходит суммы абсолютных значений элементов исследуемой матрицы. Тривиальным примером служит матрица, все элементы которой неотрицательны (неположительны). В контексте данной статьи представляет интерес неравенство
IK-1|ki < К"1!^ (27)
которое позволяет получить нижнюю оценку величины £*:
е*> (ХХ-1!*) • (28)
ы
Условия, при которых неравенства (27) и, соответственно, (28) обращаются в равенства, представляют, очевидно, определенный интерес, поскольку в этом случае проверка невырожденности соответствующей интервальной матрицы е перестает быть МР-трудной. Для того, чтобы прояснить эти условия, не обязательно манипулировать матрицей А"1. Покажем, что справедлива следующая
Лемма 2. Пусть А £ КпХ,г - произвольная невырожденная матрица. Для того, чтобы выполнялось условие
И|те,1 = Х>,-| (29)
ы
достаточно, чтобы при одновременном изменении знаков всех элементов некоторых строк матрицы А она могла быть преобразована к матрице, являющейся совокупностью неотрицательных и неположительных столбцов.
доказательство. Рассмотрим сначала матрицу и = (иг]) £ епхп, содержащую только неотрицательные и неположительные столбцы. Очевидно, что перестановками столбцов (которым соответствует некоторая матрица перестановок Р) матрица II может быть приведена к виду
ир=[и+ и-],
где и+ £ шпхк, и_ £ КпХ(п~к), 11+ > 0, и- < 0. Пусть 0 < к < п, т.е., один из блоков 11+ или II- может быть пустым. Пусть
X =
и
1 п — к
где £ и 1п-к £ к - векторы, состоящие из единиц. Тогда, как несложно убедиться,
(иРх*)г = - =
3 3 3
\\иРх*\\1 = ^\(иРх)1\ = ^\игз1
«' ьз
ЦРжЦоо = ||Ж*||оо = 1,
- ||№|11 = ||№1, = £ К|-
Пусть теперь для некоторой матрицы А выполняется условие
(А)г = 6г ■ (11%
где (A)i и (и){ - строки с номером % соответствующих матриц, = 1, причем знак числа 8{ произволен. Очевидно, что матрица А удовлетворяет требованиям леммы. В то же время, для любой строки г
(АРх*)г = 6г-[ у \и+)гз - >
Кроме того,
/ I ~~ / J
3 / 3
\\АРх*\\, = ^ \ (АРх*)г\ = X • К,| = X \ач\.
i ьз ьз
Но тогда
П^Поо,! =тах = тах \\АРх\\, = \\АРх% = ]Г \ач\.
□
Следует заметить, что
Ик = 2>*1 " (3°)
ьз
это мультипликативная матричная норма [5].
В силу теоремы 2 и леммы 2 можно утверждать, что не каждая задача проверки невырожденности интервальной матрицы вида (2) является МР-трудной. В следующей теореме определяется возможный класс полиномиальных задач.
Теорема 3. Невырожденность интервальной матрицы е с невырожденной матрицей Ас может быть проверена за полиномиальное время, если матрица А"1 представляет собой совокупность неотрицательных и неположительных столбцов или приводится к такому виду изменением знака всех элементов некоторых своих строк.
Доказательство. В силу теоремы 2, леммы 2, формул (29), (30) и исходных предположений настоящей теоремы проверка необходимых и достаточных условий невырожденности матрицы е сводится к вычислению параметра
1-1М-1
^ЧК"1!!, (31)
и проверке условия
е < е
(32)
Но вычисление обратной матрицы в формуле (31) может быть выполнено за полиномиальное время, как и остальные арифметические действия в формулах (31), (32). □
Заметим, что в случаях, попадающих под действие теоремы 3, за полиномиальное время может быть решена и обратная задача, т.е., для некоторой невырожденной матрицы Ас за полиномиальное время может быть найдено значение параметра е, при котором интервальная матрица е будет невырожденной или, наоборот, вырожденной. В приведенном ниже примере мы воспользуемся указанным результатом для того, чтобы оценить чувствительность имеющих явную форму и проверяемых непосредственно критериев невырожденности (4)-(6) и критериев вырожденности (8)-(10) на двух модельных интервальных матрицах вида (2) (невырожденной и вырожденной) с общей центральной матрицей Ас, но разными радиусами интервала г и г*.
1 ± 1
, т.е., Ас - матрица Гильберта 2-го порядка.
Пример 1. Пусть Ас =
Свойства матриц Гильберта хорошо известны (см., например, [4]). В частности, матрицы Гильберта являются симметричными рациональными положительно определенными матрицами с положительными элементами, а матрицы, обратные к матрицам Гильберта, являются целочисленными, причем знаки их элементов чередуются в шахматном порядке. Последнее означает, что для исследуемой матрицы А"1 выполняется условие (29).
Как несложно убедиться, Ас 1 =
4 -6 -6 12
28
и шах и и ифо 1М1
достигается, например, на векторе и =
1 -1
. В соответствии
с теоремой 1, х = А
-1
и =
10
-18
У = 28
1 -1
, Н = —иут =
Ас + Н =
27 15
-1
28
28
28 -1
28
28 15
28 25
28 84
е ЩАс,е*Е).
Таким образом, интервальная матрица е* оказывается вырожденной, и это предельный случай, поскольку для любого е < е* интервальная матрица А^с е является невырожденной.
Положим е = и проверим чувствительность имеющих явную форму достаточных условий невырожденности (4)-(6) для матрицы А^е, и чувствительность имеющих явную форму достаточных условий вырожденности (8)-(11) для матрицы А^е*. Результаты данного исследования сведены в таблицу 2.
Анализ представленных результатов показывает, что только один из критериев, а именно, критерий достаточных условий невырожденности (4), оказался достаточно чувствительным и позволил распознать невырожденность исследу-
с
Таблица 2. Результаты проверки чувствительности достаточных условий невырожденности и вырожденности в примере 1
Достаточные условия невырожденности А^ £ Достаточные условия вырожденности А^ £,
14 Р{\А~1\-бЕ) = -(условие (4) выполнено) Amax(e£T -еЕ) = ¿г » 4.444444-Ю"3, Amm(AM)= f6 2л^ 4.321939.10"3 (условие (5) не выполнено) eigenvalues (^А1 А — (пе*)2 ■ I^j & ^ Г -1.225057-Ю"4 1 ^ [ 1.602345 J (условие (6) не выполнено а ) max (s*E\A~1\)n = А (условие (8) не выполнено) О 1 max (e*E^A-%J(e*E]A-1\)Jl = — v 196 (условие (9) не выполнено) 29 2л/ГЗ Атах(АтА) = — + ъ 1.606789 Хтш(£*ЕТ ■ е*Е) = 0 (условие (10) не выполнено) eigenvalues (s* ЕТ ■ s* Е - АТ A) Pd ^ Г -1.602117 1 ^ [ -3.892243-Ю"4 J (условие (11) не выполнено)
"Можно показать, что для любой матричной нормы, подчиненной векторной норме Гёльдера с показателем 1 < р < +оо выполняется условие ЦЕ1)) = п, в силу чего Це^Е11 • е*Е\\ = (пе*)'2.
емой интервальной матрицы А^с£. Оказывается, это произошло не случайно, поскольку, как удалось выяснить, справедлив следующий результат.
Теорема 4. Пусть интервальная матрица е такова, что матрица Ас является невырожденной, а для А"1 справедливо условие (29). Тогда критерий (4) является не только достаточным, но и необходимым условием невырожденности матрицы А^с е.
доказательство. Получим в начале несколько полезных вспомогательных соотношений.
Пусть 1 £ К™ - вектор, состоящий из единиц. Тогда
Е = 1-1т, (33)
ы
K-^-i-K"1!-!. (34)
С учетом соотношения (33) можно записать
\А^\еЕ = е-(\А^\.1)Л\ (35)
Заметим, что выражение в правой части равенства (35) позволяет увидеть, что
rank \ A~l\eE = 1. (36)
Пусть
Ж = Ис_1| • (37)
Тогда, с учетом (34) и (35) получаем
\А;1\еЕ-х= ^-ХХ-1!*) -Ис"1!-^ ^ЕИс"1!^
т.е., число l^"1!«.?' является собственным значением матрицы \A~l\eE, а
вектор ж, задаваемый формулой (37), является соответствующим собственным вектором указанной матрицы. Но в силу условия (36) только одно собственное значение матрицы \А~1\еЕ может быть ненулевым, в силу чего
p(\A:1\eE) = e-J2\A:1\ij. (38)
ы
Предположим теперь, что интервальная матрица ААс е является невырожденной, но условие (4) не выполняется:
р(\А-с1\еЕ)>1.
Последнее предположение в силу равенства (38) можно переписать в виде
i,j V i,j /
что с учетом заявленного для матрицы Ас 1 условия (29) означает, что
£ > ЦА'1^!,
а это противоречит условию (26) теоремы 2. □
3. Чувствительность необходимых и достаточных уело-
О О А Т
вии невырожденности интервальной матрицы ААс £ к погрешностям в задании элементов матрицы Ас
Пусть интервальная матрица е отвечает условию теоремы 3. Тогда, как было показано выше, проверка необходимых и достаточных условий ее невырожденности сводится к вычислениям по формулам (31), (32). При этом наиболее
проблемной операцией в практических вычислениях является обращение матрицы Ас. Речь идет о том, что, во-первых, решение практических задач, как правило, осуществляется в арифметике с плавающей точкой и конечной разрядностью, что неизбежно порождает ошибки округления. Во-вторых, элементы матрицы Ас изначально могут быть заданы с ошибками. В третьих, задача вычисления А"1 может быть плохо обусловленной (например, из-за того, что матрица Ас близка к вырожденной). Все три причины порождают погрешности в вычислении матрицы А"1, которые при определенных условиях (например, если сопс! Ас > 1) могут быть значительными. В то же время, может оказаться, что сумма абсолютных значений элементов матрицы А"1 будет более устойчива и к ошибкам в исходных данных и к ошибкам округления, чем отдельные элементы матрицы А"1.
В настоящем параграфе мы получим априорную оценку для абсолютной погрешности параметра £*, обусловленную ошибками в элементах матрицы Ас, а также рассмотрим численный пример. При этом основным математическим инструментом будет слегка модифицированная с учетом специфики нормы 11 -11 классическая теория априорного анализа ошибок в обратных матрицах и решениях линейных систем. Так, приводимые ниже выкладки до формулы (40) следуют логике выкладок параграфа 5.8 книги [5].
Пусть Ас £ К™*™ - некоторая невырожденная матрица, которую будем считать точной. Пусть Ас £ К™*™ - возмущенная матрица. Положим Б = Ас — Ас, И = (<1{1). Тогда можно записать
Ас = Ас ■ (I + А~1Б). Предположим теперь, что матрица Ас обратима. Тогда
А-1 = {I + А-1 Пу1 ■ А~\
При определенных условиях матрицу (/ + А~1Б)~1 можно разложить в степенной ряд. Как известно, для этого достаточно выполнения условия
\\А;^\\ < 1 (39)
для некоторой мультипликативной матричной нормы || • ||. Заметим, что условие (39) достаточно и для обратимости матрицы Ас.
Тогда
А;1 = (/ + А~10)~1 = ^(-^(А;1^ • Л"1,
к=0
оо
II4"1 - Л"1 II < Е IIAclDWk ■ llAc_1|| = 1 ! • II4-1!!,
откуда получаем верхнюю границу относительной ошибки при вычислении Ас 1 вместо А~
с
Le"1:
= * ' .1 ' < ll^ll (40) 7 IK"! -1-WA-1DW [ J
Формулу (40) отделяет один шаг от классической формулы оценки относительной погрешности обращения возмущенной матрицы, использующей мультипликативные нормы ||АС||, ||А"11| и ||-D||. Он заключается в принятии гипотезы || А"11| • ||Z)|| < 1 и использовании кольцевого свойства мультипликативной матричной нормы ЦА"1/)!) < ЦА"1!) • ||-D||. Мы сделаем этот шаг несколько иначе. Для дальнейших выкладок перейдем к конкретной мультипликативной матричной норме || • Ц^ и заметим, что величину ЦА"1/)!^ с учетом формулы (31) можно оценить как
IlA~clD\\h < X К-Чу шах К,| = S/e*, (41)
hj
где
S = ||D||li00 =max \db3\. (42)
«J
Примем теперь дополнительное предположение
S < е*. (43)
Заметим, что в силу соотношений (41),(42) и с учетом предположения (43) условие (39) остается выполненным, и его можно переписать в виде
\\A7lD\\h < S/e* < 1.
С учетом (31), (41) и предположения (43) соотношение (40) примет вид
S/e* , ч
т 5 ГГЦР- (44)
Но, в силу (31), число 7 является относительной погрешностью величины, обратной к величине е*. Обозначим символом е относительную погрешность числа е*, а символом а - абсолютную. Тогда, как следует из элементарной теории погрешностей и соотношения (44), справедливо неравенство
е = <т/е* < S/e*,
откуда и получаем основное соотношение данного параграфа:
а < S. (45)
Приведенные выше рассуждения фактически являются доказательством следующей теоремы.
Теорема 5. Пусть некоторой точной невырожденной матрице Ас £ удовлетворяющей условию
е* = и:1^1,! = \\А
сопоставлена приближенная матрица Ас £ К™*™ такая, что
5= \\АС- Ас|к°° < е*.
Тогда абсолютная погрешность а определения минимального радиуса е* вырожденной интервальной матрицы Адс е, возникающая при замене Ас на Ас, не превосходит числа 8.
Пример 2. Пусть Ас =
При этом
5 10 9
14 49 112
10 374 115
49 3087 2352
9 115 9
112 2352 448
0.3571428571 0.2040816327 0.0803571429 0.2040816327 0.1211532232 0.0488945578 0.0803571429 0.0488945578 0.0200892857
^с 11оо,1
478 -1890 2688 "
-1890 7938 -11760 1
2688 -11760 17920
IK"1!!,";1 1 59012 « 1.6945706 • 10"5
Как несложно заметить, матрица Ас является симметричной рациональной матрицей с положительными элементами. Приведем ее собственные значения
eigenvalues (Ас
2.02608421725821 209.021824499095 26124.9520912836
чтобы, с одной стороны, убедиться в ее положительной определенности, а с другой стороны, в том, что ее число обусловленности, определенное, например, с использованием спектральной нормы, достаточно велико для небольшой по размерам матрицы:
Cond Ас = \\Ас\\2 ■ \\А~% ~ 12894.3071.
Рассмотрим теперь семейство приближенных матриц г = 3,4, ...,8, получающихся из матрицы Ас округлением ее элементов до % значащих цифр с последующим переводом в рациональную форму.
вычисления проводились в среде MathCad 2000 Professional.
Например,
жз) =
1
(1(3))-! =
1000 1000
577
ст(3) = |£* _ е(3)
357 204 80
204 121 49
80 49 20
-19 160 -316
160 -740 1173
-316 1173 -1581 577
h 5638000 ^ 8.5395550 • Ю-5,
¿(з) = ||Д, - I(3)||lj00 и 3.5714286 • 10"4
1.0234126 • 10
-4
Заметим, что объекты (А^) 1, и вычисляются точно с исполь-
зованием рациональной арифметики 2, а представления в виде чисел с плавающей точкой для сгМ) и ¿(г)) использованы для лучшего восприятия численных значений указанных параметров.
Результаты эксперимента представлены в таблице 3 и на рисунке 1.
Таблица 3. Зависимость величин еW и сгМ от
i eW (7 ¿W Примечание
3 1.02341 • 10" -4 8.53956 10" -5 3.57143 • 10" -4 £*<(7(3)<S(3)
4 2.68025 • 10" -5 9.85683 10" -6 4.67768 • 10" -5
5 1.89082 • 10" -5 1.96248 10" -6 4.55782 • 10" -6 <rW<8W<e* £^>£*
6 1.66170 • 10" -5 3.28682 10" -7 4.42177 • 10" -7 a(6)<S(e)<£* £^<£*
7 1.69283 • 10" -5 1.73986 10" -8 4.28571 • 10" -8 *W<8W<e* £^<£*
8 1.69456 • 10" -5 9.29399 10" -11 4.28571 • 10" -9 a(S)<S(S)<£* £^<£*
Как несложно заметить, представленные результаты хорошо согласуются с выводами теоремы 5. Более того, условие (45) выполняется при всех значениях параметра г, что свидетельствует о достаточно высокой устойчивости оценивания параметра е* по формуле (31) к погрешностям в элементах матрицы Ас. Однако также хорошо видно, что практическая ценность полученных оценок е^ не равнозначна. При значениях <С е*, соответствующих г = 6,..., 8, мы не просто получаем сгМ < ¿(г\ но и е^ < е*, сгМ <С т.е., мы незначительно ошибаемся в определении величины £*, причем ошибаемся в меньшую сторону,
2Автор использовал MathCad 2000 Professional.
Рис. 1. Зависимость от г.
и это гарантирует нам, что интервальная матрица А^ е(г) будет невырожденной. Заметим, что выполняется и условие <С что также является весьма положительным фактом, поскольку в практических вычислениях мы не можем непосредственно проверить условие (43) и вместо величины £*, которая как раз и полежит оцениванию, будем пользоваться ее приближенным значением, полученным в результате вычислений.
При 8М рй £*, что примерно соответствует г = 4,5, результаты оценивания величины £* по величинам е^ являются уже не столь хорошими вследствие того, что > £* и сгМ Ра £*. Другими словами, абсолютная ошибка а оценивания величины £* становится опасно большой, поскольку сопоставима с самой величиной £*, и при этом мы ошибаемся в большую сторону, так что матрица АТА е(г) будет ошибочно классифицирована как невырожденная, а на самом деле будет вырожденной. Но следует заметить, что > е* и мы уже не вправе в этом случае использовать предоставляемую теоремой 5 априорную оценку погрешности. В то же время вполне можно считать, что ра ра е^5), т.е., ситуацию, когда максимальная по абсолютной величине ошибка в элементах Ас сопоставима с величиной минимального радиуса £*, при котором интервальная матрица А^с е является вырожденной, в разбираемом примере можно выявить, пользуясь не величиной е*, а ее оценкой
Наконец, при г = 3, когда уже е*, получаем сгМ > что означает
фактическую невозможность даже примерно оценить величину е* по значению е^3). Но в этих условиях интервальная матрица А^ уже гарантировано является вырожденной. К такому же заключению приходим, пользуясь вместо е* ее оценкой £^3\ поскольку 8(3) > е^3).
Анализ указанного численного примера, таким образом, показывает, что, с одной стороны, абсолютная погрешность вычисления параметра е* ведет себя так, как предписывает теорема 5. С другой стороны, проблемы, вызванные влиянием погрешностей в элементах матрицы Ас, на величину £*, являются реальностью, и, что вполне естественно, труднопреодолимы в том случае, когда указанные погрешности становятся по абсолютной величине сопоставимы с е*.
Еще раз подчеркнем, что в настоящая работа не претендует на исчерпывающее или даже достаточно полное исследование влияния погрешностей на точность проверки необходимых и достаточных условий невырожденности интервальных матриц вида (2), вытекающих из теоремам 2 и 3. Многие аспекты указанной проблемы, как например, исследование влияния погрешностей округления при вычислении величины е* в арифметике с конечной разрядностью, вполне могут быть темой отдельного исследования.
Благодарности
Автор благодарит своего научного руководителя доктора физико-математических наук, профессора Горелика Виктора Александровича за ценные замечания и внимание к работе. Автор также выражает признательность
организаторам 12-й Всероссийской конференции "Математическое программирование и приложения" (Екатеринбург, 2003 г.) за возможность представления и обсуждения близких к теме настоящей статьи результатов из области матричной коррекции несовместных систем линейных алгебраических уравнений. Особую благодарность автор выражает доктору физико-математических наук Шарому Сергею Петровичу за то, что именно он обратил внимание автора на проблему исследования невырожденности интервальных матриц, а также любезно предоставил труднодоступные для автора полные тексты статей [8],[11] и некоторые другие материалы по интервальному анализу.
СПИСОК ЛИТЕРАТУРЫ
1. Ерохин В.И. Оптимальная матричная коррекция и регуляризация несовместных линейных моделей // Дискрет, анализ и исслед. операций. Сер. 2. 2002. Т. 9. № 2. С. 41-77.
2. Ерохин В.И. О нижней оценке нижней грани нормы матрицы, корректирующей несовместную систему линейных алгебраических уравнений // Инф. бюллетень Ассоциации математического программирования. 2003. № 10. С. 103-104.
3. Тихонов А.Н. О нормальных решениях приближенных систем линейных алгебраических уравнений // Докл. АН СССР. 1980. Т. 254. № 3. С. 549554.
4. Форсайт Дж., Моулер К. Численное решение систем линейных алгебраических уравнений. М.: Мир. 1969.
5. Хорн Р., Джонсон Ч. Матричный анализ. М.: Мир. 1989.
6. Шарый С.П. Алгебраический подход во "внешней задаче" для интервальных линейных систем // Фундаментальная и прикладная математика. 2002. Т. 8. № 2. С. 567-610.
7. Beeck Н. Zur Problematik der Hüllenbestimmung von Intervallgleichungssystemen // Interval Mathematics. К. Nickel ed. Lecture Notes in Computer Science. Berlin: Springer-Verlag. 1975. V. 29. P. 150-159.
8. Coxson G.E. Computing exact bounds on elements of an inverse interval matrix in NP-hard // Reliable Computing. 1999. V. 5. № 2. P. 137-142.
9. Nemirovskii A. Several NP-hard problems arising in robust stability analusis // Mathematics of Control, Signals and Systems. 1993. V. 6. N5 1. P. 99-105.
10. Neumaier A. Linear interval equations // Interval Mathematics. K. Nickel ed. Lecture Notes in Computer Science. Berlin: Springer-Verlag. 1985. V. 212. P. 109-120.
11. Rex G., Rohn J. Sufficient conditions for regularity and singularity of interval matrices // SIAM Journal on Matrix Analysis and Applications. 1999. V. 20. № 2. P. 437-445.
12. Ris F.N. Interval Analysis and Applications to Linear Algebra // PhD thesis. Oxford: Oxford University. 1972.
13. Rohn J. Systems of linear interval equations // Linear Algebra and Its Applications. 1989. V. 126. P. 39-78.
14. Rohn J. Checking positive definiteness or stability of symmetric interval matrices is NP-hard // Commentationes Mathematicae Universitatis Carolinae. 1994. V. 35. № 4. P. 795-797.
15. Rump S.M. Solving algebraic problems with high accuracy //A New Approach to Scientific Compupation, U. Kulisch and W. Miranker eds. New York: Academic Press. 1983. P. 51-120.
16. Rump S.M. Verification methods for dense and sparse systems of equations // Topics in Validated Computations. J. Herzberger ed. North-Holland. Amsterdam. 1994. P. 63-135.
17. Rump S.M. Bounds for the componentwise distance to the nearest singular matrix // SIAM Journal on Matrix Analysis and Applications. 1997. V. 18. № 1. P. 83-103.
18. Seif N.P., Hassanein M.A., Deif A.S. Inverse problem of the interval linear system of equations // Computing. 1999. V. 63. № 2 P. 185-200.