УДК 512.643.5
ОБ ОДНОЙ ЗАДАЧЕ АНАЛИЗА ВОЗМУЩЕНИЙ СОБСТВЕННЫХ
ЗНАЧЕНИЙ МАТРИЦЫ
© 2008 А. М. Фрумкин
доц. кафедры электротехники, электроники и автоматики, канд. тех. наук,
e-mail: frumkinam@mail. ru Курский государственный технический университет
Статья посвящена формулировке и доказательству теоремы, обосновывающей упрощенный метод определения собственных значений матрицы, разделенной вертикально на два блока так, что элементы нижнего блока малы.
Ключевые слова: матрица, собственное значение, спектр, блок, теорема Г ершгорина.
В технических исследованиях иногда возникает необходимость оценить собственные значения матрицы, вертикально разделенной на два блока так, что элементы нижнего блока малы. Естественный путь решения такой задачи - сначала определить группу собственных значений, предполагая, что элементы нижнего блока равны нулю, затем оставшиеся (малые) собственные значения определять с учетом строения нижнего блока. Предлагаемая в данной статье теорема уточняет смысл описанного подхода. Перед тем как сформулировать теорему, уточним используемые далее понятия и обозначения.
Тексты доказательств заключаются между значками ^ ^ . Возникновение противоречия обозначается значком И. Функции рассматриваются как отношения определенного вида [Фор 1966]. Мощность множества X обозначается как сагё(Х); набор натуральных чисел, заключенных между т и п (включая т,п), - т.п. Открытый круг в множестве комплексных чисел с центром геС радиуса р - 0(2,р), замкнутый -0(г,р), р-окружение множества Х^С - 0(Х,р), внутренность X - 1п1;(Х). Для конечных
1 .11
множеств 2^С используется функция ё(2) = — тт х - у .
2 х,у лхФу
Множество корней полинома р обозначается как 2(р)={геС: р(г)=0}, функция, которая каждому корню г ставит в соответствие его кратность, - как у(р,г), а число корней, лежащих в множестве О<^С с учетом их кратности, - как
и(р, О) = ^ у( р, г) . В статье используется следующий вариант утверждения о
г еОп 2(р)
непрерывной зависимости корней полинома от его коэффициентов: если хотя бы один коэффициент полинома р отличен от нуля, то для любого ^е2(р) и любого
0 <в< тт Д - ^ можно найти такую окрестность Ор полинома р (как набора
де2(р)\{А,}
коэффициентов), что из деОр следует и^,0(^,в))=у(рД). Как следствие, для любого 0<в<ё(2(р)) можно найти такую окрестность Ор полинома р, что из qeQp следует 2(Я)^0(г(р),8).
Элементы рассматриваемых матриц считаются комплексными. Для любой рассматриваемой pxq-матрицы а в качестве нормы [Ланкастер 1978] используется
q
величина ||a|| = max ij . Для описания блочного строения матриц используются 1<1<Pj=!
обозначения системы Matlab [Дьяконов 1999]. Спектр матрицы а обозначается S(a). Так же, как для полинома, v(a,') обозначает функцию, которая каждому XeS(a) ставит в соответствие его кратность.
Сформулируем теорему Гершгорина [Ланкастер 1978]. Пусть a:1.nx1.n^C -
матрица. Для ke1n обозначим р k = ^|a kl|, Ok={zeC: |z-akk|<Pk} - радиусы и круги
1e1,n\{k}
n
Гершгорина. Для Me1,n обозначим Wm = U о k. Тогда: 1) S(a) е U о k; 2) если
k eM k = 1
Me1,n, N=1,n\M и WMnWN=0, то ^ v(a, X) = card(M) .
XeS(a) n Wm
В рассуждениях используется как сама эта теорема, так и метод ее доказательства. Лемма. Пусть Л, X - nxn-матрицы, Л - диагональна, Y=A+X, ||X||<d(S(A)). Тогда отношение ф={(Х,|): XeS(Y)A|eS(A)A|X-||<||X||} является функцией. При этом для каждого |eS(A) имеет место равенство ^v(Y Х ) = v(A, |).
Хеф_1({|})
< Пусть |1,|2GS(A)A|1^|2AZGQ(|1,||X||)nQ(|2,||X||). Тогда |z-|1|<||X|| a |z-|2|<||X|| ^ ||1-|2|<2||X||<||1-|2| ■, то есть круги Q(|,||X||), соответствующие различным |, не пересекаются. Рассмотрим круг Гершгорина Ok матрицы Y. Пусть zeOk, |=Akk. Тогда |z-|-Xkk|<Pk ^ | |z-||-|Xkk| |<|z-|-Xkk|<Pk ^ |z-||-|Xkk|<Pk^|z-||<||X||. Таким образом, QkeQ(|,||X||). Если XeS(Y), то по теореме Гершгорина найдется ke^n: XeOk ^ XeQ(Akk,||X||) ^ 3 |eS(A): |X-||<||X||. Так как круги Q(|,||X||), соответствующие различным |, не пересекаются, то | единственно и ф^^^^^). Далее для |eS(A) определим M={ke1n: Akk=|}. Тогда v(A,|)=card(M). Пусть XeS(Y)nWM. Тогда для некоторого keM XeOk ^ XeQ(|,||X||) ^ ф(Х)=|. Обратно, пусть ф(Х)=| ^ X eQ(i,||X||). Тогда по теореме Гершгорина найдется ke1n: XeOk. Неравенство Akk^l невозможно, так как в этом случае XeQ(|,||X||)nQ(Akk,||X||)^0 ■. Поэтому Akk=| ^ keM XeWM. Таким образом, ф"1({|})=S(Y)nWM и равенство ^v(Y X ) = v(A, |)
Хеф_1({|})
непосредственно следует из второго заключения теоремы Гершгорина. ^
Сформулируем основное исследуемое утверждение. В нем рассматривается (m+n)x(m+n)-матрица у, разделенная вертикально на два блока высоты m и n соответственно.
Теорема. Пусть aH:1,mx1,m^-C, aT.:1,mx1,n^-C, BH:1,nx1,m^-C, BT.:1,nx1,n^-C, -матрицы, причем aH обратима и не имеет кратных собственных значений. Буквы «Н» (high) и «L» (low) подчеркивают, что определяемый объект связан с верхними (нижними) частями рассматриваемых далее векторов-столбцов. Пусть a=[aH aL], P=[Ph
= [a; sp] ункция числа S. Тогда спектр у S(y) обладает
Pl], У =
sp
следующими свойствами.
1. Найдутся такие р1(а,Р)>0 и 51(а,Р)>0, что при |5|<51(а,Р) отношение ф1(5)={(Х,ц): Хе8(у)лде8(ан)^{0}л|Х-ц|<р1(а,Р)|5|} отображает Б(у) на
8(ан)о>{0}, причем каждое дє8(ан) имеет единственный прообраз (то есть [ф1(5)]-1:8(ан)^8(у)).
2. Если матрица (Рь-Рнан- аь) обратима и не имеет кратных собственных значений, найдутся такие р2(а,Р)>0 и 52(а,Р)>0 (52(а,Р)<51(а,Р)), что при 0<|5|<52(а,Р) отношение ф2(5)={(Х,д): ^є[ф1(5)]-1({0}) л дє8(5(рь-рнан-1аь)) л |Х-д|/|д|<р2(а,Р)|5|} взаимно-однозначно отображает [ф1(5)]-1({0}) на
8(5(Рь-Рнан 1аь)).
^ В рассуждениях будем использовать следующие обозначения. Символ 0(р,д) обозначает рхд-матрицу, содержащую одни нули, 0р - нулевой вектор-столбец пространства Ср, Ер - диагональную матрицу тождественного оператора размера рхр. Верхний и нижний компоненты вектора хєСт+п длины т и п соответственно будем обозначать как хнєСт и хьєСп.
0(т, т + п)
Рассмотрим матрицы А =
а
0(п, т + п)
В =
5р
. Матрица А вырождена,
то есть 0є8(А). Пусть Хє8(А)\{0}, х - принадлежащий X собственный вектор. Тогда Ах=[анхн+аьхь; 0п]=Х[хн; хь]^хь=0п^анхн=Ххн, то есть Хє8(ан). Обратно, из анхн=Ххн следует А[хн; 0п]=Х[хн; 0п] ^ Хє8(А). Итак 8(А)=8(ан)^{0}.
Так как ан не имеет кратных собственных значений, найдется такая невырожденная
матрица к, что к- анк - диагональна. Тогда матрицы Р =
к
-ан1а ь
0(п, т) Ег
Р -1 =
-1
к 1ан1а ь
к
0(п, т) Еп
у=А+В) имеем: Р-1уР=Л0+5Б, где
приводят А к диагональному виду Л0=Р-1АР и (в силу
Б =
к 1ан1аьрнк к 1ан1аь(рь -рнан1аь)
р н к
Рь -рнанаь
Положим р1(а,Р)=||Б||, 51(а,Р)=ё(8(Л0))/||Б||=ё(8(ан)о'{0})/||В||. Первое заключение теоремы следует из леммы.
Для доказательства второго заключения сначала докажем разложение Ст+п в прямую сумму образа и ядра матрицы А. ^ Если уе1т(А), то уь=0. Обратно, если уеСт+плуь=0, то у=А[ан-1ун; 0п] и уе1т(А), то есть 1т(А)={уеСт+п: уь=0} и &т(1т(А))=т. Кег(А)={хеСт+п: ах=0т}. Пусть е1...еп - базис Сп. Если у=[ун; уь]еКег(А), то ун=-ан-1аьуь. Если представить уь как линейную комбинацию ек, то ун представляется как линейная комбинация -ан-1аьек с теми же коэффициентами, то есть у представляется линейной комбинацией векторов Гк=[-ан-1аьек; ек] (ке 1,п). С другой стороны, вместе с ек векторы Гк линейно независимы. Поэтому ё1т(Кег(А))=п, то есть ё1т(Кег(А))+ё1т(1т(А))=т+п.
Пусть у=Кег(А)п1т(А), то есть Ау=0лЗхеСт+п: у=Ах. Тогда Ах=[ах;
0п]^Ау=[анах; 0п]. Так как Ау=0 и ан обратима, то ах=0^у=0, то есть
Кег(А)п1т(А)={0}. Следовательно, Ст+п = Кег(А) + 1т(А) . ^
Пусть Хе8(у). Разложим соответствующий собственный вектор уФ0т+п на компоненты хеКег(А) и г=[Ь; 0п]е1т(А). Тогда из равенства уу=Ху c учетом у=А+В, Ах=0, х=[хь; хн], хн=-ан-1аьхь следуют два равенства:
(ан-ХЕт)Ь=-Хан"1аьхь, и 5(Рь-Рнан"1аь)хь+5РнЬ=Ххь (хьФ0п).
Выберем 5з из условий 83<81(а,Р) и р^а,Р)83 | |ан-1 11 <1, то есть
8з<ш1п{81(а,Р),1/(р1(а,Р) 11 ан-1 | | )}. Пусть 0< 18 | <83 и Хе[ф1(8)]-1({0}). Тогда | Х | <Р1(а,Р) 18 | и потому | | Хан-1 11 <р1(а,Р) 18 |• 11 ан-1 | | <1. Следовательно, Еш-Хан-1 обратима (если для
Я
матрицы X | | X | | <1, то (Е + X) = £ (-1) X и | | (Е-Х)-1 | | <1/(1- | | X | | ) [Ланкастер 1978]),
к=0
первое из уравнений (1) разрешается относительно И: И=-Х(Еш-Хан-1)-1ан-2аьхь и второе уравнение принимает вид:
8(Рь-Рнан-1аь)хь=Х[Еп+8Рн(Еш-Хан-1)-1ан-2аь]хь или
[(Рь-Рнан 1аь)-(Х/8)(Еп+8Рн(Еш-8(Х/8)ан 1) 1ан 2аь)]хь=0п.
В силу хь^0п число Х'=Х/8 является решением уравнения:
9(Х',8)=ёе1;[(Рь-Рнан 1аь)-Х'(Еп+8Рн(Еш-8Х'ан 1) 1ан 2аь)]=0. (2)
Приведем и=(Рь-Рнан-1аь) к диагональному виду матрицей Р: Р-1ЦР=Л. Обозначим У(Х',8)=Р-1Рн(Еш-8Х'ан-1)-1ан-2аьР. Тогда (2) принимает вид:
9(Х',8)=ёе1[Л-Х'(Еп+8У(Х',8))]=0. (3)
Обратно, если при 0< 18 | <83 число X' является решением (3) (то есть | 8Х' | . 11 ан-1 | | <1), то 8Х'еБ(у), а если | 8Х' | <ё(8(Л)), то 8Х'е[ф1(8)]-1({0}). Поэтому проанализируем решения (3) (далее знак штриха при X опущен). Обозначим
0(8)={ХеС: | 8Х|• 11 ан-1 | | <1л9(Х,8)=0}.
Пусть Хе0(8). Тогда найдется хеЯп\{0п}: [Л-Х(Еп+8У(Х,8))]х=0п. Выберем номер ре1, п : Уке^п |хр| >|хк| . Так как х^0, |хр| >0. Запишем р-ую строку равенства
[Л-Х(Еп+8У(Х,8))]х=0п (др - элемент главной диагонали Л):
п
дрхр - Ххр - £ Х8Уркхк = 0, откуда к = 1
Д р - Х
х
к=1
< £ |Х8| Урк |хк I < |Х8| хр £
У
к=1
рк
< Х8 • У •
х
Сокращая на хр и учитывая мультипликативность нормы, получаем:
| Др-Х | < | 8Х | • | | У | | < | 8Х | • | |Р-1 | | • | | Рн | | • | | ан-2 | | • | | аь| | • | |Р | |/(1-| 8Х | • | | ан-1 | | )
Обозначим
ршах = шах |Д|, Де8( Л)
Рш1п = ш1п |Д| , Де8( Л)
а0=| | Р 1 11 • 11 Рн 11 • 11 ан2 11 • 11 аь 11 • 11 Р | | ,
-2 •
Ь0=11 ан-1 11 ^ршах, а= 18 | а0, Ь=18 | Ь0 и получим неравенство для £=| Х/др |:
Х Х Х
1 - < 1 - — <
Д р Д р Д р
1 -
Х
Д
р
<
8д
ан1
Х а
Д р Х • Ь
1-
Д р
Из него следует, что либо ^>1 л ^-1<а^/(1-Ь^), либо ^<1л 1-^<а^/(1-Ь^). Пусть |8 <8 4 = 1
. Тогда а+Ь<1 и 1/Ь>1. Первая группа неравенств
(л/а0 + л/Ь0)
приводится к виду: ^>1 л ^Ь<1л Ь^2-(1+Ь-а)^+1>0. Выбор | 8 |<84 обеспечивает вещественность корней трехчлена, определяющего последнее из неравенств:
а
р
Л0 = 2Ь (1 + ь - а -^(1 + ь - а)2 - 4Ь) ’ Л1 = — ^1 + Ь - а + -у/(1 + Ь - а)2 - 4ь) < —-(1 + Ь + д/(1 + Ь)2 - 4ь) = ь .
а* и ^ и и
С учетом равенства (1+Ь-а)—-4Ь=(1-Ь-а)—-4аЬ
1 I — —а , ч
ло -1 = тг(1 - Ь - а -л/(1 + Ь - а) - 4Ь) =-------------------1 _ ^=> 0. (5)
2Ь 1 - Ь - а + уІ(1 - Ь - а)2 - 4аЬ
Таким образом, есть два промежутка возможных значений [1,л0] и [л 151/Ь). Вторая группа неравенств приводится к виду: £<1 л ^Ь<1л Ь^2-(1+Ь+а)^+1<0. Корни трехчлена, определяющего последнее из неравенств:
1 (
$ 0 = 2Г(l + b + a - sj(1 + b + a)2 - 4b] =
2b 1 + b + a + V(1 + b + a)2 - 4b
$1 = — (l + b + a + -\J(1 + b + a)2 - 4b
Так как 1 + Ь + а+ (1 + Ь + а) _4Ь — 1 + Ь + а+ д/(1— Ь + а) + 4аЬ >2(1 + а)>2, то ^0<1 л д1>1/Ь, и имеется один промежуток возможных значений [$0,1). В итоге либо | Х/дР | е[30,Ло], либо | Х/дР | е [ль1/Ь). С учетом | Х/дР | <л0 из (4) следует, что Л 0Р
1 - л oq
. В итоге, при I б I <б4 для любого Хє0(б) либо найдется д^(Л):
I III ЛОР
д-Х<ш-------------, либо найдется ^eS(A): | X | > | д | Л1. Функция
1 -Л0Ч
ЛОР
Л(5) =---------= Ло(5) - 1, согласно выражению (5), монотонно возрастает с | 5 |, причем
1 - ЛОЧ
lim л(5) = 0 . Функция Л 1(5) = 1 + — (l - b - a + д/ (1 - b - a)2 - 4ab J монотонно
5^0 2b( ->
убывает с | 5 |, причем lim Л1(5) = +^ . Найдем 55 из уравнения pmax■л(55)=d(S(Л)) и 56 из
5^ О
уравнения Pmm^^^Pm^+d^^)). Примем р2=л(55)/55. Пусть | 5 |<57=min{54,55,56}. Покажем, что тогда отношение ф(5)={(дД): дeS(Л)лXe0(5)л | X-д | < | д | р2 15 |} инъективно отображает S(Л) в 0(5).
^ Рассмотрим матрицу: V(X,5)=P"1pH(aH-5XEm)"1aH"1aLP. Элемент матрицы
(aH-5XEm)-1 имеет вид: p(5,X)/det(aH-5XEm), где p(5,X) - некоторый полином от X степени не выше m-1. Следовательно, элементы V'^-X5V(X,5) - дробно-линейные функции X, числители которых - полиномы от X степени не выше m, а знаменатели одинаковы и равны det(aH-5XEm). Разложим 9(X,5)=det[V'-XEn] по степеням X, рассматривая элементы V' как целое: 9(X,5)=(-1)nXn+v1Xn-1+v2Xn-2+vn. Коэффициент vk -это сумма, каждое слагаемое которой является произведением k элементов из V', то есть vk - дробно-рациональная функция, числитель которой имеет степень не более km, а знаменатель (то есть [det(aH-5XEm)]k) имеет степень km. После приведения к общему знаменателю (им является [det(aH-5XEm)]n) числители выражений vkXn-k становятся полиномами степени не выше mn+n-k=(m+1)n-k, а нулевой член (-1)nXn становится дробью, числитель которой является полиномом степени (m+1)n. Таким образом,
9(Х,5)=р(5,Х)/[ёе^ан-5ХЕт)]п, где р(5,Х) - полином от Х степени (т+1)п, первый коэффициент которого есть §тп(-1)(т+1)п. Если 5^0, то первый коэффициент р отличен от нуля, если 5=0, то отличен от нуля его свободный член, равный ёе^Л). Таким образом, при всех 5 для р(5,Х) верно сформулированное в начале статьи утверждение о непрерывной зависимости корней от коэффициентов, а значит от 5.
Рассмотрим де8(Л). Обозначим 00={2еС: |7-д| <| д| р257}, 05={2еС: |7-д| <| д| р2 |5 |}. При 0< 15 | <57 имеет место равенство
0(5)пО5=2(р(5/))пО0.
^ Ясно, что 0(5)пО5е2(р(5/))пО0 в силу 0(5)е2(р(5/))лО5еО0. Для произвольного 2е00 при |5 |<57 оценим величину 1-^5 |.11 ан-1| | , считая, что а=а(55), Ь=Ь(55). Имеем:
| д |+Р2 | д | | 57 | < | д | (1+л(55))< | д | Л0(55)<РтахЛ0(55). Поэтому
1- | 25 |• 11 ан-1 11 >1-Ртах 15 |• 11 ан-1 11 Л0(55)=1-ЬЛ0='1 (1 - Ь + а + д/(1 + Ь - а)2 - 4Ь) >0.
Пусть теперь Хе2(р(5/))п00. Тогда Хе00, то есть | Х5 | • 11 ан-1 | | <1^Хе0(5). Пусть Х^05. Тогда либо найдется д'е8(Л)\{д}: ХеО(д', | д' | р2 15 |), либо найдется д'е8(Л): | Х | > | д' | л1(5). Пусть ХеО(д', | д' | р2 15 |). Тогда по выбору 57 ХеО(д',ё(8(Л))), то есть О(д'Д8(Л)))пО0^0^О(дД8(Л)))пО(д'Д8(Л)))^0 ■.
Пусть | Х | >Л1(5) | д' | >Л1(5б) | д' | >РminЛl(56)>Рmax+d(8(Л)).
Тогда | Х|>| д|+ё(8(Л))^ | Х-д | >| | Х| - | д| |>ё(8(Л)), то есть Х^О0е0(дД8(Л))) ■.
Следовательно, ХеО5^Хе0(5)пО5. Итак 0(5)пО5=2(р(5/))пО0. ►
Докажем, что V 0< 15 |<57 и(р(5/),00)=1. ^ При 5=0 р(0,Х)=ёе1;(Л-ХЕп) и найдется единственное и некратное Хе2(р(0/))п00, а именно Х=д, поэтому в некоторой окрестности нуля и(р(5/),00)=1. Пусть 0< 15 | <57 и и(р(5/),00)^1. Обозначим t=mf{те[0,1]: и(р(т5,.),00)^1}. Возможны следующие ситуации. 1) В 00 нет корней р05/). Тогда все корни лежат строго вне 00 и найдется такое 0<т<^ что все корни р(т5/) останутся вне 00 ■. 2) В 00 есть по крайней мере два различных корня Х1 и Х2 р05Д Тогда Х1, Х2е0йеЫ(00) и найдется такое 0<т<^ что в 1П;(00) окажутся различные корни р(т5,) ■. 3) В 00 единственный корень Х р05/) кратности к>1. Тогда Хе0й^Ш;(00) и найдется такое 0<т<1;, что в 1п^00) окажется либо более одного корня р(т5,.), либо корень кратности более 1. ■. ^
Следовательно, для любого де8(Л) найдется единственное Хе0(5)пО(д, | д | Р2 15 |), то есть ф - функция. Если для разных д1,д2е8(Л) Х одно и то же, то окажется, что 0(д1,| д11 Р2 15 |)пО(д2,| д2|Р2 15 |)^0 ■, то есть ф инъективна. ^
Определим теперь 58 из уравнения РшпЛ^^Р^а^), 59 из уравнения
Ртах(1+Л(59))59=^8(А)) и 52=min{57,58,59}. Пусть 0< 15 | <52 и Хе[ф1(5)]-1({0}). Тогда, в силу | 5 | <53, Х'=Х/5е0(5) и | Х' | <Р1(а,Р). Так как | 5 | <54, для Х' либо найдется де8(Л): | д-Х' | < | д | л(5), либо найдется де8(Л): | Х' | > | д | л 1(5). В последнем случае
Р1(а,Р)> | д | Лl(5)>Рmin•Лl(5), но, в силу | 5 | <58, РттЛ1(5)>Р1(а,Р) ■. Поэтому | д-Х' | < | д | л(5), то есть Х'=ф(д), причем д5-Х < д5 Л(5)< д5 Р2 5 и, в силу инъективности ф, д единственно. Обратно, если Х'=ф(д), то Х=5Х'е8(у) и | д5-Х | < | д5 | Р2 15 | и | Х|<| д | (1+л(5)) | 5 | <Ртах(1+л(5)) | 5 |<ё(8(А)) и, в силу | 5 | <51, | Х|<Р1(а,Р) |5 |, то есть Хе[ф1(5)]-1({0}). Другого Х1е[ф1(5)]-1({0}), обладающего свойством | д5-Х11 < | д5 | л(5), быть не может, так как из | 5 | <53 следует, что Х1/5ее0(5)^Х1=ф(д). Итак, мы доказали, что ф2 из второго заключения теоремы является биекцией. ^
Библиографический список
1. Фор, Р. Современная математика / Р. Фор, А. Кофман, М. Дени-Папен. - М. : Мир, 1966. - 272 с.
2. Ланкастер, П. Теория матриц / П. Ланкастер. - М. : Наука, 1978. - 280 с.
3. Дьяконов, В. П. МАТЬАВ 5.0/5.3 Система символьной математики / В. П. Дьяконов, И. В. Абраменкова. - М. : Нолидж, 1999. - 640 с.