Вычислительные технологии
Том 3, № 2, 1998
ТОЧНАЯ ВЕРХНЯЯ ОЦЕНКА СПЕКТРАЛЬНОГО РАДИУСА НЕРАСШИРЯЮЩИХ МАТРИЦ
А. В. Лакеев
Институт динамики систем и теории управления СО РАН
Иркутск, Россия e-mail: [email protected]
In this paper, it is shown that a real Cayley transformation establishes one-to-one correspondence between P-matrices and nonexpanding matrices that play one of the leads in the computation of algebraic solutions to interval linear equations. Relying on the correspondence constructed, we prove that the problem of checking whether a matrix is nonexpanding or not is co-NP-complete, and obtain unimprovable upper estimations for the spectral radius, determinant and sum of principal minors of nonexpanding matrices.
1. Введение
Матрица А Е Мгахга называется нерасширяющей (или, более кратко, N-матрицей1 ), если не существует вектор х Е Кга, х = 0, такой, что |Ах| > |х|. Понятие нерасширяющей матрицы, по-видимому, впервые было введено А. Ноймайером в монографии [1] (но в неявной форме присутствует в более ранней работе И. Рона [2]) и связано с исследованием линейных уравнений с модулями вида
х = А|х| + а, (1)
где А — п х п-матрица, х и а — п-мерные векторы, модуль вектора х понимается покоординатно. А. Ноймайер также показал [1], что матрица А является нерасширяющей тогда и только тогда, когда уравнение (1) имеет единственное решение при любом а Е Кга.
Уравнения вида (1) появляются естественным образом при описании вершин (крайних точек) объединенного множества решений систем интервальных линейных уравнений [2], а также при решении линейных алгебраических уравнений в полной интервальной арифметике Каухера [3-5]. Более того, уравнение вида (1), как отмечено А. Ноймайером [1] (см. также [2]), легко преобразуется в ставшую уже классической задачу о линейной дополнительности [6]. Действительно, раскладывая х в уравнении (1) на положительную и отрицательную части, т. е., полагая и = тах{х, 0}, V = тах{—х, 0}, получаем, что х = и—V, |х| = и + V, и уравнение (1) принимает вид
(I — А) и = (I + А) V + а,
1Nonexpanding в англоязычной терминологии © А. В. Лакеев, 1998.
и > 0, V > 0, и^ = 0, г = 1,п. (2)
Это простое замечание позволяет установить соответствие между Ж- и Р-матрицами (см. Предложение 1 ниже) и получить ряд интересных свойств Ж-матриц.
Известно [1], что условие р(|А|) < 1 (где р(-) — спектральный радиус, а модуль матрицы понимается поэлементно) достаточно для того, чтобы матрица А была Ж-матрицей. Там же приводится простой пример Ж-матрицы, для которой это условие не выполняется. В связи с этим возникает вопрос: насколько большим может быть спектральный радиус N матрицы? Ответу на этот вопрос и посвящена, в основном, данная работа.
В дальнейшем мы используем стандартные понятия из теории матриц [7, 8]) и теории сложности вычислений [9].
2. Соответствие между N - и Р -матрицами
Согласно [6], матрица А называется Р-матрицей, если все главные миноры матрицы А (строго) положительны. В дальнейшем нам понадобится следующая характеризация Р-матриц [10].
Лемма 1 [10]. Матрица А является Р-матрицей тогда и только тогда, когда для любого х = (Ж1,...,Ж„)Т = 0 и у = (у1,...,уп)т = Ах найдется г € 1,п, такое, что ^ > 0.
Рассмотрим следующее хорошо известное дробно-линейное преобразование К над матрицами ([7], с. 261), называемое (вещественным) преобразованием Кэли:
К(А) = (I + А)-1(/ - А), (3)
(где I — единичная матрица), определенное для всех матриц А таких, что — 1 не является собственным числом.
Обозначим через V область определения К, то есть V = { А € | —то € ^(А) }, где а(А) — спектр матрицы А. Тогда легко проверить, что К отображает V в V и, более того, очевидно следующее утверждение. Лемма 2. Для всех А € V
К2 (А) = К(К(А)) = А,
следовательно, К отображает V на V и обратное преобразование совпадает с К.
Обозначим теперь через N класс всех Ж-матриц и через Р — класс всех Р-матриц. Очевидно, что Nc V и РСР, то есть преобразование Кэли определено для любой М-матрицы и для любой Р-матрицы.
Предложение 1. К(Р) = N и К(.М") = Р, таким образом, матрица А является Ж -матрицей тогда и только тогда, когда К(А) является Р-матрицей.
Доказательство. В силу Леммы 2 достаточно показать только включения К(Р) С N и К(^) С Р.
Покажем, что К(Р) С N. Пусть В € Р и А = К(В). Допустим, что, вопреки доказываемому, А € N. Тогда найдется вектор х € Кга, х = 0, такой, что для у = Ах и для всех г € 1, п выполняется неравенство | yi | > | х^|.
Так как А = К(В) = (I + В)-1 (I — В), то у = (I + В)-1(1 — В)х. Умножая обе части этого равенства на (I + В), легко получаем, что В(х + у) = х — у. Но тогда для г = В(х + у) имеем (xi + у^г = (xi + у^( xi — у^ = х2 — у2 < 0, так как | х^ < | у^. Однако В является
Р-матрицей, поэтому из Леммы 1 получаем х + у = 0, а значит, и х — у = В(х + у) = 0. Сложив последние два равенства, получим х = 0, что противоречит выбору вектора х. Следовательно, А £ N.
Покажем теперь, что К(^) С Р. Пусть А £ N и В = С(А). Опять допустим противное: В £ Р. Тогда, в силу Леммы 1, найдется вектор х £ Кп, х = 0, такой, что для у = Вх и для всех г £ 1,п выполняются неравенства х^ < 0. Так же, как и в предыдущем случае, из равенства В = С(А) = (I + А)-те(Т — А) и у = Вх получаем А(х + у) = х — у. Обозначим г = А(х + у). Тогда, учитывая что х^ < 0, получаем = |х^ — у^| = |х^| + |у^| > |х^ + у^|, то есть |А(х + у)| > |х + у|. Но А £ N, поэтому х + у = 0, а значит и х — у = А(х + у) = 0. Следовательно, х = 0, что опять противоречит выбору вектора х. Предложение доказано.
Замечание. Выше приведено прямое доказательство Предложения 1. Но его можно также получить, используя представление уравнения (1) в виде (2), упомянутую теорему А. Ноймайера и И. Рона, утверждающую, что А £ N тогда и только тогда, когда уравнение (1) имеет единственное решение при любом а £ Кп, и характеризации Марти [11] Р-матриц, согласно которым В £ Р тогда и только тогда, когда линейная задача о дополнительности вида
х = Ву + Ь, х > 0, у > 0, XiУi = 0, г = 1,п, имеет единственное решение при любом Ь £ Кп.
3. Задача выяснения нерасширяемости матрицы co-NP-полна
В работе [12] Г. Е. Коксон показал, что задача выяснения по заданной матрице с рациональными коэффициентами, является ли она Р-матрицей, ео-МР-полна. Непосредственным следствием этого результата и Предложения 1 является следующее утверждение.
Предложение 2. Задача выяснения по заданной матрице А с рациональными коэффициентами, является ли она N-матрицей, аа-ЫВ-полна (в частности, ЫВ-трудна).
Доказательство. То, что эта задача лежит в классе ео-МР, очевидно. Далее, определим для любой матрицы В матрицу С (В):
р(В) = Г I, если det(/ + В) = 0,
К(В) = \ (I + В)-1(1 — В), если det(/ + В) = 0.
Так как по заданной невырожденной матрице и определитель и ее обратная вычисляются полиномиальными алгоритмами (см., например, [13]), то и С(В) вычисляется по матрице В полиномиальным алгоритмом. Кроме того, в силу Предложения 1 В £ Р тогда и только тогда, когда С(В) £ N. Таким образом, мы получаем полиномиальное сведение ео-МР-полной задачи выяснения того, будет ли заданная матрица Р-матрицей, к исследуемой задаче и, следовательно, она также ео-МР-полна. Предложение 2 доказано.
4. Оценка спектрального радиуса ^-матриц
Всюду в дальнейшем будем использовать следующие обозначения: Nn — множество п х п-матриц из N, Рп — множество п х п-матриц из Р, Е& (А) — сумма всех главных миноров
порядка к (к < п) квадратной п х п-матрицы А [7] (при этом считаем, что Е0(А) = 1),
п
Ра (А) = ёе^А/ — А) = ^ Ап-г(—1)гЕ (А) — характеристический полином матрицы А. Для
г=0
оценки спектрального радиуса матриц из Мп нам понадобится следующее утверждение о корнях вещественного полинома с положительными коэффициентами.
Лемма 3. Пусть п > 2 и а1 > 0,...,ап > 0. Тогда для любого корня А полинома f (х) = хп + а1Жп-1 + • • • + ап выполняется неравенство
А + 1 А- 1
< ctg
п 2ñ'
(4)
Доказательство. Пусть А комплексное число, такое, что f (А) = 0. Представим его в тригонометрической форме
А = r(cos + i sin (5)
где r > 0, |<^| < п. Подставляя А в f (x) и приравнивая нулю вещественную и мнимую части, получаем
g(r, f) = rn cos nf + ßirn cos (n — 1)f + ■ ■ ■ + an-1r cos f + an
0,
(6) (7)
h(r, = rn sin n^ + airn sin(n — 1)^ + ■ ■ ■ + an-1r sin ^ = 0.
Так как an > 0, то из (6) очевидно следует, что r = 0 и ^ = 0.
Более того, покажем, что для ^ должно выполняться неравенство
м > -
n
Действительно, если 0 < ^ < п/n, то sin ^ > 0, sin 2^ > 0, ... , sin(n — 1)^ > 0 и sinn^ > 0. Но тогда h(r, > an-1r sin ^ > 0, что противоречит (7). А если —п/n < ^ < 0, то sin < 0, sin 2^ < 0, ..., sin(n — 1)^ < 0 и sin n^ < 0. Но тогда h(r, < an-1r sin ^ < 0, что также противоречит (7).
Далее нетрудно показать, что для А вида (5)
А + 1 А - 1
1 + r2 + 2r cos f 1 + r2 — 2r cos f
(8)
Рассмотрим теперь два случая: п/2 < |<^| < п и п/n < |<^| < п/2.
Если п/2 < |<^| < п, то cos ^ < 0, и из (8) получаем (учитывая что n > 2)
А +1 А - 1
< 1 < ctg
п 2ñ'
Следовательно, в этом случае (4) выполняется.
Если же п/n < |<^| < п/2, то cos ^ > 0, и для таких ^ верно легко проверяемое неравенство
1 + r2 + 2r cos 1 + cos ^
<
1 + r2 — 2r cos f 1 — cos f
ctg
2'
Следовательно, при n/n < |<^| < п/2, учитывая, что функция |ctg (<^/2)| четная и строго убывает при ^ G [п/n, п/2], получаем
А + 1 А - 1
<
4- f
ctg2
ctg
п
< ctg 2n
Таким образом, и в этом случае неравенство (4) выполняется. Лемма 3 доказана. Теорема 1. Для любой матрицы А Е Мп, п > 2,
п
p(Ä) < ctg —
(9)
и оценка (9) не улучшаема, то есть для любого £ > 0 найдется матрица Ä£ Е Nn, такая, что
п
P(Äe) > ctg — - £. (10)
Доказательство. Возьмем Ä Е Nn и положим B = K(A). Тогда, в силу Предложения 1, B Е Pn и Ä = K(B) = (I + — B). Обозначим ßb • • • , ßn все собственные числа матрицы B. Хорошо известно [6], что тогда все собственные числа матрицы
n
Ä имеют вид ai = (1 + вг)— 1 (1 — ßi). Кроме того, так как pB(А) = Y1 An-i(—1)гЕДВ) и
i=0
Ег(В) > 0 (поскольку В является P-матрицей), то числа Yi = — ßi являются корнями
n
полинома f (А) = An-iEi(B) с положительными коэффициентами. Следовательно, по
i=0
Лемме 3, получаем
|a»| =
1 — ßi 1 + Yi
1 + ßi 1 — Yi
< ctg
п
Поэтому и p(A) = max{ | i = 1,n } < ctg (n/2n). Неравенство (9) доказано. Для доказательства (10) рассмотрим следующие nxn-матрицы:
(
B (d)
d 0
10 d1
0 0 0 ••
у (—1)n+1 0 0 ••
00 00
d1 0d
(11)
/
Покажем, что при ^ > 0 матрица В(^) является Р-матрицей. Действительно, любая главная к х к-подматрица С матрицы В будет иметь вид
d £1 0 0 d £2
C
V
0 0 0 5 0 0
0 0
0 0
d £k-1 0d
/
где £i Е { 0,1 }, i легко получаем
1,k — 1, и 5 Е {0, (—1)n+1}. Раскладывая det C по первому столбцу,
det C = dk + (—1)k+15£1 ...£k-1.
Далее нетрудно заметить, что при к < п либо 8 = 0, либо е^ = 0 для некоторого г = 1, к — 1. Таким образом, при к < п, С = дк > 0, а при к = п, В(^) = дк + 1 > 0 и, следовательно, В(^) Е Рп.
Также, раскладывая по первому столбцу ёе1(А/ — В(^)), получаем
PB(d)(A) = det(A1 — B(d)) = (А — d)n + (—1)n.
Следовательно, характеристические числа матрицы B(d) имеют вид
2k + 1 . . 2k + 1
в = d — cos-n — i sin-n, k = 0, n — 1.
n n
Рассмотрим теперь матрицу A(d) = (d)) G Ее характеристические числа: ak (1 + вк)-1 (1 — вк), k = 0,n — 1- В частности, полагая k = 0, получаем p(A(d)) > |a0| |(1+ во)-1(1 — во)|- Легко показать, что | a0| можно представить в виде
_ /d2 + 4(1 - d) cos2(n/2n) 1 ao1 _ у d2 + 4(1 + d) sin2(n/2n)'
и, следовательно, при d ^ 0 получаем p(A(d)) ^ ctg —. Поэтому при d достаточно малом
2n
будет выполняться неравенство (10). Теорема 1 доказана.
5. Оценка E&(A) для N-матриц
Функции Efc(A) и, в частности, det A, будучи симметричными функциями собственных чисел матрицы A, также допускают некоторые оценки, зависящие только от размерности матрицы
A е N\. Через C^ буде м обозначать биномиальные коэффициенты. Теорема 2. Для 1 < k < n и любой матрицы A е Nn
|Efc(A)| <СП, (12)
причем оценка (12) неулучшаема, то есть для любого £ > 0 найдется матрица Ae е Nn, такая, что
|Ek(A)| >СП - £. (13)
В частности, при k _ n получаем, что для любой матрицы A е Nn
| det A| < 1. (14)
Доказательство. Докажем вначале неравенство (14). Пусть A eNn и B _ K(A) ePn. Тогда A _ K(B) и, следовательно, если a^, i _ 1, n — характеристические числа матрицы A, то ßi _ (1 + а^)-1(1 — a^), i _ 1, n — все характеристические числа матрицы B. Поэтому, если
PB (А) = J>1)*£i(B )An-i
г=0
характеристический полином В, то аг будут корнями уравнения / (А) = 0, где { 1 _ А \ п { 1 — А \п-г 1 п
/(А) = и ( т—; ) = £(-т№(В) ( г-а ) (Г1ГА)П£(-1№(В)(1 - А)п"'(1 + А)
Умножая /(А) на (1 + А)п, можем заключить, что аг, г = 1,п будут всеми корнями полинома
n
g(A) = ^(-1)г£г(£)(1 - A)n-i(1 + А)' = (-1)^ Ei(B)(А - 1)n-i(A + 1)г.
г=0 '=0
г
Если же разделить этот полином на коэффициент при Ап, равный (—1)п^П=0 Ei(B), то получим характеристический полином матрицы А (так как оба эти полинома имеют одни и те же корни и их коэффициенты при Ап равны единице).
Таким образом, приходим к следующему представлению для р^(А):
-1
P4(A) = det(A/ - A) = £ Ei(B) ^ Ei(B)(А - 1)n-i(A + 1)г ). (15)
\ ¿=0 /\ i=0
Далее, так как Pa(0) = (— 1)n det A, то из (15) получаем
/га \ — 1 / n
det A = £ Ei(BM J](-1)iEi(B) ) . (16)
i
i=0 i=0
Поскольку Ei(B) > 0, i = 1,n (так как B G Pn), из (16) очевидно следует, что | det A| < 1.
Чтобы доказать неравенство (12), нам достаточно заметить, что каждая главная подматрица N-матрицы будет тоже N-матрицей (этот факт следует непосредственно из определения N-матриц). Но тогда модуль определителя каждой главной k х k-подматрицы, в силу уже доказанного, меньше единицы, а так как их число равно СП, то получаем, что неравенство (12) тоже выполняется.
Докажем теперь (13). Для этого снова воспользуемся матрицами B(d) вида (11). Как уже отмечалось при доказательстве Теоремы 1, характеристический полином B(d) имеет вид
PB(d)(A) = (A - d)n + (-1)n
Используя те же рассуждения, что и при выводе формулы (15), нетрудно показать, что характеристический полином матрицы A(d) = K(B(d)) G Nn будет иметь вид
(A) (A(d +1) + d - 1)n + (A + 1)n
P4(d)(A) =-(d +1)n + 1-• (17)
Так как коэффициент при An-k этого характеристического полинома равен (- 1)kEk(A(d)), то из (17) получаем
(-1)k Ek(A(d)) = ^(d +l)"-k(d- 1)k + Cn-k
v ; ky (d + 1)n + 1
и, следовательно, учитывая, что СП-к = СП,
* <А(^))=(—«к- сп+;ГЛ;П+Г1 • (18)
Из (18) очевидно следует, что |Ек(А(^))| ^ Ск при d ^ Поэтому при d достаточно
большом будет выполняться неравенство (13). Теорема 2 доказана.
6. Оценка р(|А|) для N-матриц
В данном разделе обозначим Мпхп — множество всех п х п-матриц и Спхп — множество всех невырожденных п х п-матриц.
Если A, А 6 Rnxn и А > 0, то через [A — A, A + Д] будем обозначать интервальную матрицу с центром A и радиусом А, то есть [A—A, A+A] = { A' 6 Rnxn | A—A < A' < A+A}.
Интервальная матрица называется невырожденной (регулярной), если все матрицы A' 6 [A — A, A + A] невырождены, в противном случае интервальная матрица называется вырожденной (сингулярной).
В работе [14] для A, A 6 Rnxn, A > 0 была введена следующая величина, названная радиусом невырожденности:
a(A, A) = sup { a > 0 | [A — aA, A + aA] невырождена } .
Впоследствии З. М. Румп в работе [15] показал, что для функции
Y(n) = sup{ a(A, A)p(|A-1|A) | A 6 Gnxn, A 6 Rnxn, A > 0 }
имеет место оценка
Y(n) < (3 + ^v/2)n. (19)
Покажем, что верно следующее утверждение.
Лемма 4. y(n) = sup { р(| A-11 A) | [A — A, A + A] невырождена}. Доказательство. Обозначим
Y1(n) = sup { p(|A-1|A) | [A — A, A + A] невырождена} .
Заметим, что для любых A, A 6 Rnxn, A > 0 интервальная матрица [A — A, A + A] невырождена тогда и только тогда, когда a(A, A) > 1. Поэтому, если [A — A, A + A] невырождена, то A 6 Gnxn и p(|A-1|A) < а (A, A)p(|A-1|A). Переходя к супремуму в обеих частях последнего неравенства, получаем, что Y1(n) < Y(n).
Обоснуем обратное неравенство. Возьмем A 6 Gnxn, A 6 Rnxn, A > 0. Пусть 0 < a < a(A, A). Тогда интервальная матрица [A — a A, A + a A] невырождена и, следовательно, по определению Y1(n), выполняется неравенство p(|A-1|(aA)) < Y1(n), то есть
ap(|A-1|A) < Y1(n). (20)
Устремляя в неравенстве (20) a к а (A, A) получаем a(A, A)p(|A-1|A) < Y1(n) и, следовательно, Y(n) < Y1(n). Лемма 4 доказана. Рассмотрим теперь функцию
/(n) = sup{ p(|A|) | A 6Nn }.
Тогда верно следующее утверждение. Теорема 3. /(n) < Y(n).
Доказательство. Заметим, что множество матриц будет открыто в Rnxn. Это вытекает, например, из следующей характеризации нерасширяющих матриц (см. [1], Теорема 6.1.3.):
A 6 Nn ^^ для любой D ( |D| = I ^ det(1 — AD) > 0 ),
где I — единичная матрица.
Так как Gnxn всюду плотно в Rnxn, то N, П Gnxn всюду плотно в N\. Поэтому из непрерывности спектрального радиуса получаем, что
/(n) = sup{ p(|A|) | A 6 Nn П Gnxn } = sup{ p(|A-1|) | A-1 6 N„, A 6 Gnxn }.
Далее, согласно Теореме 6.2.1 из [1], интервальная матрица [A — A, A + А] невырождена тогда и только тогда, когда выполняется условие
для любой D ( |D| = 1 ^ A-1DA е Nn ).
Отсюда очевидно следует, что если A — невырожденная матрица, то A-1 является нерас-ширяющей тогда и только тогда, когда интервальная матрица [A — 1, A +1] невырождена и поэтому
/(n) = sup { p(|A-1|) | [A — 1, A + 1] невырождена} .
Отсюда и из Леммы 4 непосредственно вытекает, что l(n) < y(п). Теорема 3 доказана. Из неравенства З. М. Румпа (19) и Теоремы 3 получаем Следствие. Для любой нерасширяющей nxn-матрицы A
p(|A|) < (3 + 2 л/2) п.
Список литературы
[1] NEUMAIER A. Interval Methods for Systems of Equations. Cambridge University Press, Cambridge, 1990.
[2] ROHN J. Systems of linear interval equations. Linear Algebra Appl., 126, 1989, 39-78.
[3] SHARY S. P. Algebraic approach to the interval linear static identification, tolerance and control problems, or One more application of Kaucher arithmetic. Reliable Computing, 2, No. 1, 1996, 3-33.
[4] KUPRIYANOVA L. Inner estimation of the united solution set of interval linear algebraic system. Ibid., 1, No. 1, 1995, 15-31.
[5] LAKEYEV A. V. Linear algebraic equations in Kaucher arithmetic. Reliable Computing, 1995, Supplement (Extended Abstracts of APIC'95: Int. Workshop on Applications of Interval Computations, El Paso, TX, Febr. 23-25, 1995), 130-133.
[6] COTTLE R. W., Pang J.-S., Stone R. E. Linear Complementarity Problem. Academic Press, N. Y., 1992.
[7] ГАНТМАХЕР Ф. Р. Теория матриц. Наука, М., 1967.
[8] ХОРН Р., Джонсон Ч. Матричный анализ. Мир, М., 1989.
[9] ГЭРИ М., ДЖОНСОН Д. Вычислительные машины и труднорешаемые задачи. Мир, М., 1982.
[10] FIEDLER M., Ptak V. On matrices with non-positive off-diagonal elements and positive principal minors. Czechoslovak Math. J., 12, 1962, 382-400.
[11] MARTY K. G. On the number of solutions to the complementarity problem and spanning properties of complementary cones. Lin. Alg. Appl., 5, 1972, 65-108.
[12] COXSON G. E. The P-matrix problem is co-NP-complete. Mathematical Programming, 64, 1994, 173-178.
[13] СхРЕйВЕР А. Теория линейного и целочисленного программирования. Т. 1. Мир, М., 1991.
[14] PoLJAK S., Röhn J. Checking robust nonsingularity is NP-hard. Mathematics of Control, Signals and Systems, 6, 1993, 1-9.
[15] RUMP S. M. The distance between regularity and strong regularity. In "Scientific Computing and Validated Numerics": Proc. of the Int. Symp. on Scientific Computing, Computer Arithmetic and Validated Numerics SCAN'95. Wuppertal, Germany, Sep. 2629, 1995. Eds. G. Alefeld, A. Frommer and B. Lang, Akademie Verlag, Berlin — N. Y., 1996, 105-117.
Поступила в редакцию 8 августа 1997 г.