Научная статья на тему 'О разрешимости квадратных матричных уравнений'

О разрешимости квадратных матричных уравнений Текст научной статьи по специальности «Математика»

CC BY
1768
92
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Палин В.В.

Статья посвящена исследованию условий разрешимости матричного квадратного уравнения Риккати, возникающего при исследовании проекции Чепмена-Энскога задачи Коши и смешанной задачи для моментных аппроксимаций кинетических уравнений. Структура матричного уравнения позволила сформулировать необходимые и достаточные условия разрешимости в терминах собственных и присоединенных векторов матрицы, составленной из коэффициентов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О разрешимости квадратных матричных уравнений»

36

ВЕСТН. моек. УН-ТА. СЕР.1, МАТЕМАТИКА. МЕХАНИКА. 2008. №6

УДК 517.9

О РАЗРЕШИМОСТИ КВАДРАТНЫХ МАТРИЧНЫХ УРАВНЕНИЙ

В. В. Палин

Введение. Статья посвящена исследованию условий разрешимости матричного уравнения Риккати

хах + вх + хс + д = о, (1)

возникающего при исследовании проекции Чепмена-Энскога задачи Коши и смешанной задачи [1] для моментных аппроксимаций кинетических уравнений (см. [2]). Здесь матрица X — комплекснозначная матрица порядка (п — т) х т, заданные матрицы

А е Мт (С), В е Мп —m,n—m(C■), С е Мт,т (С), д е Мп-т,т(С), П> т,

где М^ДС) — комплекснозначная матрица порядка I х е. Уравнение (1) является существенной частью исследования линеаризованных задач, и в этом случае оно имеет специальный вид

р1Л12 ^21 — Л22 Р21 + ^21 Лц — Л21 = 0,

(2)

А = Л12, В = —Л22, С = ЛП, Я = —Л21; матрицы Лц, Л12, Л21, Л22 являются блоками одной и той же матрицы

Л11 Л12

Л

Л21 Л22

Структура (2) матричного уравнения (1), порожденная реальными физическими задачами, позволила сформулировать необходимые и достаточные условия разрешимости уравнения (1) в терминах свойств собственных и присоединенных векторов матрицы Л.

Удивительно, но факт, что для такого классического объекта, как матричные уравнения, нет сколько-нибудь разумной теории! С. И. Гельфанд пишет [3]: "Задача в таком виде — решать квадратные уравнения для матриц — кажется абсолютно классической. Было бы естественно, что если уж не раньше, то хотя бы в XIX в. ее должны были бы по крайней мере сформулировать, да и решить. Тем не менее я спрашивал многих об этой задаче, мне давали разные советы, где это можно было бы поискать, но я нигде не смог найти даже упоминания об этой задаче". Далее Гельфанд приводит только одну ссылку — результат Д. Б. Фукса. В дополнение можно сослаться на статью В. В. Козлова [4], а также на работы [5-7].

Приведем необходимые и достаточные условия разрешимости уравнения (2), позволяющие получить обобщения результатов упомянутых выше статей, но наши интересы к этой тематике прежде всего связаны с задачами Навье-Стокс-приближения для законов сохранения с релаксацией [2]. С точки зрения проекции Чепмена-Энскога, наиболее интересен случай вырожденности старшей матрицы Л12, когда гапк(Л12) < шш{п — т, т}, что не разрешается в работах [3, 4].

Примеры С. И. Гельфанда [3]. Рассмотрим квадратное матричное уравнение Риккати

X2 + ВХ + Я = 0, В,Я е М2(С). (3)

Чтобы ощутить экзотичность этого классического объекта, приведем два примера: решением квадратного матричного уравнения X2 = 0 являются матрицы ^ ^, для которых ad — Ьс = 0, а + d = 0. Таких матриц бесконечно много, они образуют двумерный конус в С4. В противоположность этому уравнение

Х 2 = (0 1 х = 1 0 0

не имеет решения, поскольку матрица, квадрат которой обладает только нулевыми собственными значениями, сама имеет только нулевые собственные значения. То есть х нильпотентна. А квадрат любой нильпотентной матрицы второго порядка равен нулю.

ВЕСТН. МОСК. УН-ТА. СЕР.1, МАТЕМАТИКА. МЕХАНИКА. 2008. №6

37

Очевидно, что это — особые случаи. Что же происходит в неособых случаях? В скалярном виде (3) — это четыре уравнения второго порядка. Согласно теореме Безу, в общем положении должно быть 24 = 16 решений. Однако в связи с матричной структурой задачи число решений оказывается другим. В своей работе [3] С. И. Гельфанд приводит следующую гипотезу: "Насколько я понимаю, ответ на вопрос, что здесь вообще может быть, таков. Я, правда, не все умею доказывать. Но если этим не занимались классики английской алгебраической школы середины или конца XIX в., то этого никто и не знает. По-видимому, ситуация здесь такая: может быть любое число решений от 0 до 6, а также два типа бесконечности(конус и гиперболоид). Обе бесконечности двумерны".

В настоящей работе получен ответ на вопрос о том, сколько решений может иметь квадратное матричное уравнение вида (2) в зависимости от параметров т, п в большинстве случаев. В частности, приведенная выше гипотеза Гельфанда оказывается верной.

Статья построена по следующему плану. Вначале описывается, как задача о существовании проекции для линейной системы уравнений в частных производных связана с матричным квадратным уравнением типа Риккати. Далее формулируются и доказываются необходимые и достаточные условия существования решения, а также обсуждается вопрос о числе решений. Последняя часть статьи посвящена одному из важных физических примеров — системе уравнений для газа фононов.

Сведение задачи о проекции к матричному квадратному уравнению. Рассмотрим задачу Коши для одномерной линейной гиперболической системы с постоянными коэффициентами первого порядка с релаксацией [2]

дги + Лдхи + Ви = 0. (4)

Здесь х € Я, и € Яп, А и В — постоянные матрицы. Проекция Чепмена-Энскога [8] для системы (4) определяется следующим образом: и = П ис = (ис, П21ис), где ис = (щ,...,ит, 0,...,0)Т, П — псевдодифференциальный матричный оператор нулевого порядка. Пусть матрица оператора П, описывающего проекцию Чепмена-Энскога в т уравнений для системы (4), имеет вид

( П11 П12 ^21 П22

где Пц = Ет — единичная матрица размера т, П22 = 0п_т — нулевая квадратная матрица размера п — т. Обозначим через Л матрицу Лг£ + В. Разобьем ее на блоки того же размера:

Так как П — проектор, то В силу того что П2 = П, имеем Вычитая (6) из (5), получаем

л=ГЛп Л12 Л21 Л22

Пди + ЛПди + ВП ис = 0, (5)

Пди + ПЛПдхис + П ВП ис = 0. (6)

(Е — П)(Лдх + В)П ис = 0.

Обозначим через Р образ Фурье по х от оператора П. Тогда после преобразования Фурье по х последнее равенство примет вид (Е — Р)Л Рус = 0, т.е. Л Рус € кег(Е — Р). Заметим, что для любого элемента V € кег(Е — Р), если представить V в виде УТ = (у^), где Ук € М^, верно равенство Уп_т = Р21Ут. Отсюда получаем систему уравнений относительно Р21, которая полностью определяет проектор П:

Р21 (Ли + Л12 Р21) = Л21 + Л22Р21.

Заметим, что после раскрытия скобок и переноса всех слагаемых в левую часть указанное выше уравнение принимает как раз вид (2), т.е. является матричным уравнением типа Риккати.

Необходимые и достаточные условия существования решения. Сформулируем сначала несколько теорем, дающих необходимые и достаточные условия разрешимости уравнения (2) при |Л| = 0. Теорема 1. Пусть |Л| = 0, матрица Р имеет вид

Р = ( Р11 Р12 Р Р21 Р22

где Рц — единичная матрица 'размера m, Р22 — нулевая квадратная матрица 'размера n — m, P12 — нулевая матрица. Тогда матричное квадратное уравнение (2) разрешимо тогда и только тогда, когда существует матрица Р описанного ранее вида, являющаяся решением матричного квадратного уравнения

(E — Р )Л Р = 0. (7)

Действительно, пусть матричное уравнение (2) разрешимо. Тогда, составляя матрицу Р согласно условию теоремы и расписывая поблочно произведение (E — Р)Л Р, убеждаемся, что матрица Р — решение уравнения (7).

Обратно, пусть Р — решение (7), имеющее описанный выше вид. Тогда если представить матрицу M = (E — Р)Л Р в виде блоков того же размера, что и Р, то из вида матрицы Р следует, что блоки M11, M12, M22 нулевые. Уравнение для блока M21 совпадает с (2) с точностью до перемены знака, т.е. матричное уравнение (2) разрешимо.

Обозначим через ej, 1 < j < n, j-й столбец единичной матрицы E £ Mn,n (R).

Теорема 2. Пусть |Л| = 0, тогда матричное квадратное уравнение (2) разрешимо тогда и только тогда, когда найдутся два решения X1, X2 матричного квадратного уравнения

X2 — Л X = 0, (8)

такие, что:

1) X1ej = 0 для всех j > m;

2) ej X2 = ej Л для всех j < m;

3) ЛX2 = X1 Л.

Теорема 3. Пусть |Л| = 0, тогда матричное квадратное уравнение (2) разрешимо тогда и только тогда, когда найдется решение X1 матричного квадратного уравнения (8), такое, что:

1) X1ej = 0 для всех j > m;

2) ejЛ-1X1 = ej для всех j < m.

Для того чтобы дать еще одну формулировку необходимых и достаточных условий разрешимости, опишем сначала общий вид решений для матричного квадратного уравнения (8).

Лемма 1. Пусть det (Л) = 0. Пусть также векторы h1,...,hn образуют жорданов базис для матрицы X — решения уравнения (8). Тогда существует число K > 0, такое, что векторы h-1,... ,hx являются частью жорданова базиса матрицы Л, причем с сохранением порядка присоединения (т.е. если вектор hj удовлетворяет условиям Xhj = Xhj + hj-1, то Лhj = Xhj + hj-{), а векторы hx+1, ...,hn — собственные векторы, соответствующие собственному значению 0.

Лемма 2. Пусть det (Л) = 0. Тогда для любого K > 0 матрица X, жорданов базис которой составляют векторы h1,..., hn, где векторы h1,..., hx являются частью жорданова базиса матрицы Л, причем с сохранением порядка присоединения, а векторы hx+1,...,hn — собственные векторы, соответствующие собственному значению 0, является решением матричного уравнения (8).

Приведем геометрическую формулировку необходимых и достаточных условий существования решения матричного квадратного уравнения (2).

Теорема 4. Пусть |Л| = 0. Пусть, кроме того, найдутся векторы V1,... ,vm, такие, что

1) V = Lin {vj— собственное подпространство матрицы Л, т.е. Л V = V;

2) векторы V1,..., vm, em+1, ...,en образуют базис.

Тогда квадратное матричное уравнение (2) разрешимо и наоборот.

Случай общего положения. Пусть теперь |Л| = 0. Пусть VQ — линейная оболочка всех собственных и присоединенных векторов Л, соответствующих собственному значению 0. Обозначим L = dim VQ.

Определение. Будем говорить, что задача (2) — общего положения, если для любого v £ VQ выполнено равенство ej v = 0 для всех j > m.

Опишем прием, позволяющий свести задачу общего положения к рассмотренному ранее неособому случаю. Нам потребуется несколько вспомогательных лемм.

Лемма 3. Для любой квадратной матрицы A найдутся две квадратные матрицы I, M, такие, что

1) A = MI = IM;

2) матрица M обратима;

3) Iv = Av для любого v £ Vq;

4) для любого вектора v, ортогонального Vq, имеем Iv = v.

Лемма 4. Пусть задача (2) — общего положения. Пусть, кроме того, m > dim VQ. Тогда найдется матрица C, такая, что существуют две матрицы M, I, удовлетворяющие следующим условиям:

1) C-1Л C = IM = MI;

2) матрица C — блочно-диагональная: C = ( Cl ° ) , а матрица C11 — квадратная размера m;

V 0 EJ

3) матрицы M, I удовлетворяют условиям предыдущей леммы;

4) матрица I — блочно-диагональная:

'Ii 0 0 0 I2 0 0 0 E,

причем матрица Ii — квадратная, нильпотентная, размера dim V0, матрица I2 — единичная размера m — dim V0;

5) если матрицу M разбить на блоки того же размера, что и I, то M11 = E, M12 = 0, M13 = 0, M21 = 0, M31 = 0.

Представим сначала матрицу Л в виде Л = I'M', где I', M' — матрицы из предыдущей леммы. Пусть C — матрица, такая, что C-1I'C — жорданова нормальная форма матрицы I, причем вначале стоят клетки, соответствующие собственному значению 0. Тогда матрица I имеет требуемый вид. Так как задача — общего положения, то среди всех матриц C, приводящих I' к жордановой нормальной форме, найдется матрица, удовлетворяющая условию 2.

Осталось показать, что для матрицы C-1MC выполняется условие 5. Согласно предыдущей лемме, Mv = v для любого v Е V0 .С другой стороны, если матрица I имеет требуемый вид, то V0 = Lin {в1,... ,вь}, L < m. Отсюда получаем, что Mej = ej для любого j < L. Значит, M21 = 0, M31 = 0. Пусть V1 — линейное подпространство, такое, что для всех v Е V0, w Е V1 выполнено равенство vTw = 0, dim V0 + dim V1 = n. Покажем, что Mu Е V1 для всех u Е V1. Заметим, что V1 — инвариантное подпространство для Л, т.е. Л V1 = V1. Значит, оно инвариантно и для M по построению M. Отсюда следует, что M12 = 0, M13 = 0.

Заметим, что справедлив аналог этой леммы и в случае, когда L = dim V0 = m. При этом просто пропадают те блоки, которые должны иметь размер 0.

Лемма 5. Пусть C — блочно-диагональная матрица того же вида, что и в предыдущей лемме. Тогда решение матричного квадратного уравнения

(E — P ')C Л C-1P' = 0

связано с матрицей P — решением уравнения (7) — так: P'-ц = P11, P21 = P21C-11, P^ = C11P12,

P'2 = P22.

Перейдем теперь к описанию того, как задача общего положения сводится к рассмотренному ранее случаю. Заметим, что теорема 1 верна и в том случае, когда |Л| = 0. Разобьем матрицу P — описанное в теореме 1 специальное решение матричного квадратного уравнения (7) — на блоки того же размера, что и блоки матрицы I в лемме 4:

f E 0 0Ч P = I 0 E 0 W П32 0,

Согласно лемме 5, если матрица P — указанного выше вида, то и матрица P' имеет тот же вид:

/ E 0 0Ч P' = I 0 E 0 \П731 П32 0,

Теорема 5. Пусть задача (2) — общего положения. Пусть также dim V0 < m. Тогда она разрешима тогда и только тогда, когда разрешима задача того же вида для матрицы

Л' ( M22 M23

M32 M33

где матрица M описана в лемме 4.

Рассматривая уравнение (Е — Р)Л Р = 0 поблочно после замены из леммы 4, получаем систему из двух уравнений, равносильную исходному уравнению (2):

П31/1 + П32М23 П'з1 — МззП'з1 = 0, П,32М23П,32 — Мзз П32 + П32М22 — М32 = 0.

Заметим, что второе из уравнений этой системы есть уравнение вида (2) для описанной в условии матрицы Л', а первое уравнение всегда имеет решение П3л = 0. Теорема доказана.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Заметим также, что |Л'| = \М| = 0, т.е. мы привели способ сведения задачи (2) общего положения (в случае ё1ш Уо < т) к неособому случаю.

Пусть теперь ё1ш Уо = т. Тогда с помощью аналогичных рассуждений исходная задача (2) сводится к матричному квадратному уравнению вида

0 0 0 \(Е 0 Е 0\ П'21 —е) V 0 Е) V 0 М22) ^п'210) 0,

которое приводит к уравнению для П2>1: П^Д — М22П2>1 = 0. Очевидно, что последнее уравнение всегда разрешимо.

О числе решений в случае общего положения. Лемма 6. Пусть матрица А обратима, матрица В нильпотентна. Тогда матричное уравнение Ах — хВ = 0 имеет единственное решение — тождественный нуль.

Пусть х — решение уравнения Ах — хВ = 0. Так как В нильпотентна, то найдется такое число в, что В3 = 0. Домножим тождество Ах — хВ = 0 справа на В5-1. Получим АхВ5-1 = 0, откуда, учитывая обратимость А, будем иметь хВ3-1 = 0. Далее, домножая то же тождество на В3 2 справа, аналогично получаем, что хВ3-2 = 0, и т.д. Таким образом, за конечное число шагов приходим к х = 0.

Из приведенной выше леммы следует единственность решения уравнения (2) при Ь = т. Пусть теперь Ь < т.

Лемма 7. Пусть матрица Р21 — решение уравнения (2), |Л| = 0. Тогда матрица Л22 — Р21Л12 обратима.

Так как при Ь < т матричное уравнение (2) сводится к системе уравнений

ПиЛ + П32М23 П'з1 — М33П31 = 0, П'з2М2зП'з2 — Мзз П32 + П32М22 — М32 = 0,

где матрица

= /М22 М23

Л = М32 М33

обратима, а матрица /1 нильпотентна, то, согласно двум предыдущим леммам, (2) имеет в этом случае не более чем конечное число решений.

Пример: задача о проекции для системы уравнений газа фононов. В качестве примера для одномерной модели газа фононов [2, 8]

дгв + дхр = 0, дгр + афхв + дхМ + яр = 0,

дгМ + а2дхр + дх^ + N = 0,

..................(9)

дtNn-l + ап+1 дх^-2 + дxNn + ^-1 = 0, дtNn + ап+2дх^-1 + Nn = 0,

а, = ]2/(4]2 — 1), Я е (0,1)

докажем для четного п = 2к существование неприводимой проекции 2к ^ 2. Матрицу Л = (А,)п,=1 для системы (9) можно описать следующим образом:

А11 = 0, А22 = Я, А,, = 1 У]> 2, А,к = 0 У], к : ] — ^ > 1, А,,,+1 = У] = 1,...,п — 1; А,+1,, = га, £ У] = 1,...,п — 1.

Для простоты рассмотрим случай четного п = 2к. Докажем существование в этом случае проекции из п = 2к в т = 2. Для этого заметим, что |Л| = 0 для всех |£| > 0. Если же £ = 0, то матрица Л удовлетворяет условиям общности положения. Кроме того, при £ = 0 матрица Л диагональна, откуда очевидным образом следует существование проекции в два уравнения при £ = 0.

Пусть теперь £ = 0. Заметим, что если V — собственный вектор матрицы Л, соответствующий собственному значению / = 0, то еТV = 0. Действительно, пусть это не так. Тогда из вида матрицы Л следует, что /е^V = V, откуда еТV = 0. Далее из этого равенства и того, что /е^,V = а^е^V + деТV + 1£еТ V, следует, что еТV = 0, и т.д. Таким образом, получаем V = 0, что невозможно. Значит, любой собственный вектор матрицы Л, соответствующий ненулевому собственному значению, имеет не равную нулю первую координату.

Пусть теперь VI и V2 — собственные векторы, соответствующие разным ненулевым собственным значениям /1 и /2. Покажем, что тогда любая их линейная комбинация не принадлежит линейной оболочке системы векторов {еэ,..., еп}. Предположим противное. Пусть С1VI + С2V2 € Ып {еэ,..., еп}. Тогда Л(с1 VI + С2V2) = /сVI + /2^2V2 € Ып {е2,..., еп}. Отсюда получаем систему из двух уравнений с двумя неизвестными для с^:

(еТ Vl)cl + (еТ V2 )с2 = 0, /1(ет Vl)cl + /2 (ет V2 )с2 = 0.

Так как /1 = /2, то определитель этой системы не равен нулю, откуда С1 = С2 = 0. Противоречие. Значит, если V! и V2 — собственные векторы, соответствующие разным ненулевым собственным значениям /1 и /2, то любая их линейная комбинация не принадлежит линейной оболочке системы векторов {еэ, ...,еп}.

Заметим теперь, что из вида матрицы Л следует, что любому собственному значению / соответствует ровно один собственный вектор (с точностью до умножения на константу). Действительно, пусть вектор V соответствует собственному значению / и имеет вид V = ^1,..., vn)T. Тогда из явного вида матрицы Л

следует, что г>2 = ^з = ^--— и т.д., т.е. все координаты вектора V вычисляются рекуррентно

по заданной Vl. Отсюда и следует доказываемое.

Пусть теперь Vl — собственный, а V2 — первый присоединенный векторы, соответствующие ненулевому собственному значению /. Покажем, что тогда любая их линейная комбинация не принадлежит линейной оболочке системы векторов {еэ,...,еп}. Возможны два случая: еТV2 = 0 и е^2 = 0. В первом случае из условий еТ(с^1 + C2V2) =0, ] = 1, 2, и того, что вектор Vl — собственный, сразу следует С1 = С2 = 0. Если же е^2 = 0, то аналогично случаю двух собственных значений получаем систему уравнений для С1,С2:

(еТ Vl)cl + (еТ V2 )с2 = 0, (/ + 1)(еТ Vl )с1 + /(еТ V2)c2 = 0,

которая, очевидно, имеет не равный нулю определитель. Отсюда опять получаем С1 = С2 = 0.

Возвращаясь к задаче о проекции, из сказанного выше сразу же получаем, что при всех £ = 0 найдется собственное подпространство V = Ып , V2}, удовлетворяющее необходимым и достаточным условиям существования решения, т.е. проекция в два уравнения существует при всех £.

СПИСОК ЛИТЕРАТУРЫ

1. Палин В.В., Радкевич Е.В. Приближение Навье-Стокса и проблемы проекции Чепмена-Энскога для кинетических уравнений // Тр. Семинара им. И.Г. Петровского. Вып. 25. М.: Изд-во МГУ, 2006. 184-225.

2. Chen Gui-Qiang, Levermore C.D., Tai-Ping Lui. Hyperbolic conservation laws with stiff relaxation terms and entropy // Communs Pure and Appl. Math. 1994. XLVII. 787-830.

3. Гельфанд С.И. О числе решений квадратного уравнения // ГЛОБУС. Общематематический семинар. Вып. 1. М.: МЦНМО, 2004. 124-133.

4. Козлов В.В. Ограничения квадратичных форм на лагранжевы плоскости, квадратные матричные уравнения и гироскопическая стабилизация // Функц. анализ и его прил. 2005. 39. 1-14.

5. Lu Tongxing. Solution of the matrix equation AX — XB = C // Computing. 1986. 37. 351-355.

6. Prokip V.M. On the solvability of the Riccati matrix algebraic equation // Ukr. Math. J. 1994. 46, N 11. 1763-1766.

7. Shurbet G.I, Lewis T.O, Boullion T.L. Quadratic matrix equations // Ohio J. Sci. 1974. 74, N 5. 273-277.

8. Dreyer W, Struchtrup H. Heat pulse experiments revisted // Continuum Mech. Thermodyn. 1993. 5. 3-50.

Поступила в редакцию 28.03.2007

i Надоели баннеры? Вы всегда можете отключить рекламу.