Научная статья на тему 'О свойствах конечномерных систем нелинейных уравнений с кратными решениями'

О свойствах конечномерных систем нелинейных уравнений с кратными решениями Текст научной статьи по специальности «Математика»

CC BY
218
73
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЛИНЕЙНАЯ СИСТЕМА УРАВНЕНИЙ / КРАТНОЕ РЕШЕНИЕ / ИНДЕКС / ПУЧОК МАТРИЦ / ПОЛУОБРАТНАЯ МАТРИЦА / ДИФФЕРЕНЦИАЛЬНО-АЛГЕБРАИЧЕСКОЕ УРАВНЕНИЕ

Аннотация научной статьи по математике, автор научной работы — Булатов Михаил Валерьянович, Чистяков Виктор Филимонович

Рассматриваются системы нелинейных уравнений F(x) = 0, у которых матрица Якоби на решении вырождена. Для таких задач вводятся определения значения кратности решения. Установлена связь между значениями кратности решения и индекса матричных пучков. Проведено сравнение с известными определениями кратности. Обсуждаются возможные приложения введенных понятий в теории дифференциально-алгебраических уравнений, а также при анализе характера вырожденной стационарной точки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Булатов Михаил Валерьянович, Чистяков Виктор Филимонович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О свойствах конечномерных систем нелинейных уравнений с кратными решениями»

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

М. В. БУЛАТОВ, В. Ф. ЧИСТЯКОВ

О СВОЙСТВАХ КОНЕЧНОМЕРНЫХ СИСТЕМ НЕЛИНЕЙНЫХ УРАВНЕНИЙ С КРАТНЫМИ РЕШЕНИЯМИ1

Рассматриваются системы нелинейных уравнений Г(х) = 0, у которых матрица Якоби на решении вырождена. Для таких задач вводятся определения значения кратности решения. Установлена связь между значениями кратности решения и индекса матричных пучков. Проведено сравнение с известными определениями кратности. Обсуждаются возможные приложения введенных понятий в теории дифференциально-алгебраических уравнений, а также при анализе характера вырожденной стационарной точки.

Ключевые слова: нелинейная система уравнений, кратное решение, индекс, пучок матриц, полуобратная матрица, дифференциально-алгебраическое уравнение.

Введение

Во многих областях математики и ее приложений встречаются системы нелинейных уравнений

( /і (жі,Ж2, ... ,Хп)\ І2 (Жі,Х2, . . . ,Хп)

\/т(хі,Х2, . . . ,Хп)}

(1)

где Г : В ^ И™, В С Ип, х = (х1, х2,... , хп)т, Т — символ транспонирования. Предполагается, что вектор-функция Г(х) обладает той гладкостью в области определения, которая необходима для дальнейших рассуждений.

Введем обозначение для матрицы Якоби системы (1)

Ао(ж)

дР (ж) Г д/і(х)

дх

дхі

1,

> т, ]

1,

(2)

Пусть вектор х* £ В удовлетворяет системе (1): Г(х*) = 0. Вектор х* принято называть простым решением (корнем), если гапкА0(х*) = шт{т,п}. В данной работе рассматривается случай гапкА0(х*) < шт{т,п}. Такое решение называют кратным, или особым. Для определенности ниже будем считать, что кратность простого корня равна единице. Если т = п, то решение х* является кратным тогда и только тогда, когда ёе1 А0(х*) = 0. Для случая простого корня получены критерии разрешимости и разработана достаточно полная теория итерационных

0

1Работа поддержана грантом НШ-1676.2008.1 президента РФ.

методов решения системы (1) (см. например, монографии [1; 2]). Исследование систем с кратными корнями при п > 1 связано с большими принципиальными трудностями (см. например, [3; 4; 5; 6] и приводимую там библиографию).

Продемонстрируем на простых примерах трудности перенесения понятия кратности с одномерного случая на многомерный. Напомним, что при п = 1 принято называть значением кратности (или просто кратностью) корня х* минимальное целое число к > 1, для которого ^(к)(х)|х=х* =0, к =1, 2,....

Рассмотрим две системы

х1 =0

х2 =0 , (3)

=0

где ] = 1,2,... Обе системы (3) имеют единственное решение: х* = (0,0)т, х* = (0, 0, 0)т, соответственно. По аналогии с одномерным случаем еще можно предположить, что у системы ^1(х1 ,х2) = 0 кратность корня равна ]. Но для системы ^2(х1,х2,х3) = 0, у которой компоненты являются полиномами не выше второй степени, вынести какое-то заключение о кратности корня весьма затруднительно. Если решать ее, исключая неизвестные сверху вниз, то придем к уравнению х^ = 0, у которого решение имеет кратность 8. При исключении неизвестных снизу вверх мы последовательно решим уравнения

х3 = 0, х2 = 0, х1 = 0,

каждое из которых имеет решение кратности 2.

В работе [7] авторами было введено понятие кратности решения для системы (1) при п > 1, совпадающее при п =1 с классическим определением. Ниже это понятие обобщено и уточнено. В скалярном случае действие оператора дифференцирования на уравнение понижает кратность корня на единицу. По аналогии будем искать дифференциальные операторы, которые понижают кратность корня и при п > 1 , в виде выражений

= ЯI + Я;^, г = 1, 2,..., (4)

F 1(xi,x2)

x{ + =0

-- П

1 2 —

F 2(ж1,ж2,жэ)

X2

Хз

x%

где

Т д д д

qi = (c , grad) = cM------+ C2,i^---1-----+ c„,i-—,

dxi dx2 dxn

grad = (d/dx1, d/dx2, ..., d/dxn)T, ci — некоторый вектор из Rn, Oj>i — его компоненты, (•, •) — скалярное произведение в Rn, Ri, Si — (m x т)-матрицы. Они выбираются из условия

Fi(x*) = 0, Fi (x) = Li... L2L1F (x), (5)

при произвольном выборе векторов ci.

Лемма 1. В последовательности (5) равенства ^(х*) = 0 выполняются тогда и только тогда, когда А;-1(х*) = 0, г = 1, 2,...

Доказательство. Выпишем равенства

qiFi(x) = (gradT, Ci)Fi(x) = (Fi(x)gradT)c = (dFi(x)/dx)ci. (6)

Оператор (gradT, ci) является скаляром, он перестановочен с операцией умножения на матрицу Si ив силу условия леммы SiAi-1(x*)ci = 0 при всех ci £ Rn. □

Определение 1. Пусть rankA0(x*) < min{m, n} и, начиная с некоторого минимально возможного k > 1, найдутся векторы ci и матрицы Ri, Si, i =

1, 2,... , k, такие, что в последовательности (5) rankAk(x*) = min{m,n}, где Ak(x) = dFk(x)/dx. Тогда мы будем говорить, что левая кратность корня x* равна k + 1.

Если m = n, то равенство rankAk(x*) = min{m, n} эквивалентно неравенству det Afc(x*) = 0. Для вычисления матриц Ri, Si, удовлетворяющих условию (5), мы будем использовать аппарат полуобратных матриц.

Определение 2. (См., например, [8]). Матрица, обозначаемая в дальнейшем как A-, называется полуобратной к матрице A, если она удовлетворяет уравнению AA-A = A.

Полуобратная матрица определена для любой (m x ^-матрицы A и имеет размерность (n x m) [8]. Ее частным случаем является псевдообратная матрица A+, методы вычисления которой хорошо развиты (см., например, [9]).

Из определения 2 следует:

A(E - A-A) = 0, (E - AA-)A = 0, (7)

V2 = V, (E - V)2 = (E - V)2, j = 1, 2, V = AA-, V2 = A-A. (8)

Здесь и ниже EM — единичная матрица размерности ^. Если ^ = n или m, то для упрощения записи ниже полагается EM = E.

Покажем, что в равенстве (5) можно принять R = E, Si = E -Ai-1(x*)A— 1 (x*), где Ai-1(x) = dFi-1(x)/dx. Иначе говоря, вектор x* является решением систем

Fi(x) = [E + qiSi]Fi-1(x) = 0, i = 1, 2,..., (9)

где F0(x) = F(x), ci — произвольные векторы из Rn. Здесь выполнены условия леммы 1, так как в силу (7) SiAi-1(x*) = [E - Ai-1(x*)A—1(x*)]Ai-1(x*) = 0.

Процесс понижения кратности можно организовать и другим способом, выбирая векторы ci из некоторых подпространств в Rn. Рассмотрим процесс Fi(x) = [E + qiE]Fi-1(x) = 0, где qi = (aT, grad) и векторы ai выбираются из некоторого подпространства Rn. Используя формулу (6), этот процесс можно переписать в виде

Fi(x) = Fi-1(x) + Ai-1(x)ai = 0, (10)

где Fo (x) = F(x), Ai(x) = dFi(x)/dx. Если полагать, что ai = [E -

(x*) Ai(x*)]ci, где ci — произвольные векторы из Rn, то из (7) имеем Fi(x*) = 0.

Определение 3. Пусть гапкА0(ж*) < шт{ш, п}. Если, начиная с минимально возможного г = к, в равенстве (10) имеем гапкАк(ж*) = шт{ш, п}, то число к + 1 назовем правой кратностью решения ж*.

После приведения системы (1) к системе с простым корнем процессы (9), (10) стабилизируются:

^(ж) = ^1-1 (ж), ^(ж) = ^-1(ж) V* > к,

так как = Е — Аг-1(ж*)А—1(ж*) = 0, Е — А-_1(ж*)Аг-1(ж*) = 0 при условии полноты ранга матриц А^-1(ж*), А^-1(ж*).

В заключение раздела коснемся вопроса о соотношении значений левой и правой кратностей корня ж* системы (1). Для систем (3) эти значения совпадают, но можно указать примеры, когда они не равны. Рассмотрим систему

ж1ж2 = 0, ж1 — ж^ = 0.

Решение ж* = (0, 0)т единственно и его левая кратность равна 2, а правая 3.

1. Свойства А-матриц

Поставим задачу получения критериев, выполнение которых гарантирует осуществимость процессов (9), (10). Оказалось, что значения кратности корня можно вычислить, используя информацию о свойствах некоторых матричных пучков. Приведем необходимые сведения, представляющие и самостоятельный интерес.

Определение 4. (См., например, [10]). Выражение

р

М (А) = АрМо + Ар-1М1 + ••• + Мр = ^ Ар-*М;, Мо = 0, (11)

г=0

называется А-матрицей степени р. Здесь М^ — постоянные матрицы одинаковых размеров, А — скалярный параметр (в общем случае комплексный). Матрица М(А) регулярная, если матрицы квадратные и М(А) ф 0.

Определение 5. (См. [11]). Будем говорить, что А-матрица (11) обладает доминантным свойством (ДС), если

degdet М(А) > рг0, г0 = гапкМ0,

где символ deg(•) означает показатель степени многочлена (■), операция deg(0) не определена.

Если в А-матрице (11) р = 1, то ее называют пучком матриц. Для регулярного пучка существуют постоянные неособенные матрицы Р, 2 со свойством:

Р(АМо + Мі)2 = Л diag{Ed, N} + diag{7, £„_4,

где, начиная с некоторого натурального v, NV = О, J — блок подходящей размерности [lO, с. 334]. Число v равно целому числу j > О, начиная с которого справедливо равенство

rank Cj+1 = rank Cj = d, C = (ЛMo + Ml)-1Mo,

если Л не совпадает с корнем уравнения det^M0 + M1) = О. Число v называют индексом матрицы C или индексом пучка матриц ЛM0 + M1 и оно не зависит от Л [lO, с. 333]. Принимается, что v = О, если det Mo = О. Выражение в правой части равенства (l2) будем называть кронекеровой структурой матричного пучка.

Определение б. Матричный пучок ЛM0 + M1 удовлетворяет критерию "ранг-степень", если rankM0 = degdet^M0 + M1).

Из формулы (l2) следует, что пучок матриц ЛM0 + M1 удовлетворяет критерию "ранг-степень" тогда и только тогда, когда индекс пучка v = 1 или выполняется ДС. Индекс можно вычислить так: проверять на ДС произведение Л7(ЛM0 + M1). Здесь v = j + 1, где j — целое неотрицательное число, начиная с которого произведение удовлетворяет ДС.

Поставим в соответствие Л-матрице (ll) пучок матриц вида

ЛА + B = Л ^ о^ Mo) + (лтр л/) , (13)

где ^ = (p — 1)n, M = (Mp-1 Mp-2 ... Mj, и установим связи ДС с кронеке-ровой структурой матричного пучка (l3).

Лемма 2. Матрица (ll) регулярна тогда и только тогда, когда существует Л-матрица Ь(Л) со свойством

p

Ь(Л)М(Л) = B(Л) = ^ Лр-^, det Bo = 0. (14)

i=0

Более того, можно принять

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

VV

Ь(Л) = Y, Л^% = J^(E + Л^,), S, = E — V(j), V(j) = M0j)M0j)-, M0o) = Mo.

i=o j=l

Доказательство. Достаточность. Пусть det Bo = 0. Тогда матрица B^) регулярна, следовательно, регулярны оба сомножителя M(Л) и Ь(Л).

Необходимость. Пусть матрица M(Л) регулярна. Рассмотрим произведение

[Epn+л(£^—лл-)](ла+b)=Л(ы + (MMp m*) , (15)

где

Epn + MEpra — ) = Epn + Л diag{0, S0}, S1 = E — M0M0 ,

ы01) = Mo + SlMl, M = Sl (Mp Mp-1 ... M2) .

Известно ([12]), что после такой операции индекс пучка матриц слева в (15) на единицу меньше индекса пучка АА + В. Прямым вычислением показывается, что после умножения произведения (15) на матрицу

Е, 0

0 ' —М Е

мы получим пучок матриц ААі + $і, построенный по многочлену Мі (А) = (Е + А51)М(А). В силу (7) degM1(А) < р.

Покажем, что degM1 (А) = р. Существуют невырожденные матрицы Р, ф, для которых РМ0ф = diag{Er0, 0}, где гапкМ0 = г0 < п. В многочлене М1(А) при Ар стоит матрица М01) = М0 + 51М1, которую умножим на Р, ф слева и справа. Имеем

рм01}д = РМ0ф + р (е - М0^д-1М0-)Р -1рм^ =

Ег 0^ , (■Ег — 5*11 —5*12^ /"^11 ^12 \ (1 6)

0 <>] + ( 0 Е„_,) Д21 Я22) • <16)

где

11$*Н2,^=1 = ф-1 М0-Р-1, ||д*112^=1 = РМ1ф.

Следовательно, в (16) Ег — 511 = 0. Умножая в матрице (16) вторую блочную

б с - (ЕГ0 0 \

строку на блок 512 и складывая с первой, получим матрицу „ „ , где

\Л21 Л22 /

гапкМ0(1) > гапкМ0.

После повторения V раз операций вида (15) и умножения на соответствующие матрицы Рі, где і = 0,1,... , V, мы получим, что ёе1 В0 = ёе1 М0^ = 0. □

Лемма 3. Матрица (11) обладает ДС тогда и только тогда, когда индекс пучка (13) не превосходит степени А-матрицы (11): V < р.

Доказательство. Достаточность пункта 2) утверждения теоремы при предположении о выполнении ДС доказана в [12]. Докажем необходимость. Пусть количество шагов процесса равно д < р. В силу (8) все собственные числа матриц V, Е — V простые и равны 0 или 1 и

гапкР50Р-1 = п — г0, deg ёе^А(Е — у/г)) + Е ] = п — г.

Из (16) следует, что

9-1

гапкм0*+1) > гапкМ0(і), [п — г*] < (п — г0)т, і = 0,1,... , д — 1,

і=1

где г = гапкм0г). По условию deg ёе1 М(9)(А) = рп. Откуда следует, что deg ёе1 М(А) > рг0. □

Замечание 1. Из леммы 3 следует, что матрицы М0 + (Е — У1(0))М1, М0 + М1(Е — У2(0)), где у/0) = М0М-, У2(0) = М0“М0, невырожденные тогда

и только тогда, когда пучок матриц АМ0 + М1 удовлетворяет критерию "ранг-степень ".

Лемма 4. В качестве коэффициентов многочлена Ь(А) можно принять первые п строк (/ х 1)-матрицы

/Mo О О ... О .. .О О

M1 Mo О ... О .. .О О

Г- = M2 M1 Mo ... О .. .О О

О О О ... Мр .. . M1 Mo у

разбитой на (n x n)-блоки, причем

Г-Г

Г v Г V

E„ О

Gl G2

где I = (V + 1)п, С1; С2 — некоторые блоки подходящей размерности. Доказательство. Рассмотрим линейную алгебраическую систему

Tv X = 0.

(17)

Умножим ее блочные строки на коэффициенты многочлена Ь(Л) с одинаковыми номерами и сложим их. Получим, что первые n компонент вектора X равны нулю, так как первые n уравнений приобретут вид (En 0)X = 0. Любое решение системы (16) имеет вид X = [E—T-Tv]C, где C — произвольный вектор из Rn(v+1)

[8]. Так как первые n компонент вектора C равны нулю, имеет место (17). □

2. О связи доминантного свойства и кратности решений

Применим ДС к исследованию систем вида (1), предполагая, что n = m. Образуем матрицы Ai(x) по правилу

Ai(x) = qi... q2qlAo(x), Ao(x) = Ao(x), i =1, 2,...

(18)

где А0(ж) определена по формуле (2), qi — операторы из формулы (4), и построим с использованием матриц из (18) А-матрицу

А(Л) = £] Л‘-іЛі (і*).

(19)

i=0

Теорема 1. Значение левой кратности корня ж* системы (1) равно к + 1 тогда и только тогда, когда А-матрица (19) удовлетворяет ДС:

degdet А(Л) > krankA0(x*).

Доказательство. Для упрощения выкладок предположим, что k = 2. Скалярные операторы qj = (grad , Cj) перестановочны с операцией вычисления матрицы Якоби д/дх. Пусть

det дЕ2(ж)/дж|ж=х* = det[E + qiSi + q2S2 + q2q2S2Si]Ao(x)|x=x* =0.

С другой стороны, для многочлена Л(Л) = Л2W0 + AW1 + W2, Wj = Aj(x*), i =

0,1, 2, имеем

W0(2) = Wo + SiWi + S2W1 + S2S1W2,

где Sj — матрицы из формулы (9) и учтено, что SiW0 = 0, S2(W0 + SiWi) = 0.

(2)

Итак, мы получим равенство дЕ2(х)/дх|ж=ж* = W0( ). Согласно лемме 3 многочлен Л(Л) обладает ДС. Очевидно, что справедливо и обратное утверждение. Для k > 2 доказательство полностью аналогично. □

Теорема 2. Пусть существует вектор c* £ Rn, для которого пучок матриц, построенный по формуле

A(A) = AA0 + qiA0(x)|x=x*,

где ci = (E — A-A0)c*, qi = (cj", grad), A0 = A0(x*), A0(x) — матрица из (2), регулярен. Тогда правая кратность решения х* равна 2, а пучок A (А) удовлетворяет критерию "ранг-степень".

Доказательство. Согласно формулам (6), (10)

dFi(x)/dx = d[F(х) + A0(x)a]/dx = А0(ж) + (gradT, a)A0(x),

где а = (E — A-A0)c, c £ Rn. Очевидно, что в силу регулярности пучка A(А) найдется параметр 7 со свойством dFi(x)/dx|x=x* = 0, если а = 7(E — A-A0)c*. Второе утверждение теоремы вытекает из замечания 1. □

Коснемся вопроса о проверке условий теоремы 1. Очевидно следующее утверждение.

Лемма 5. Старший коэффициент многочлена

det A(A) = oj(C )Ad + ... (20)

является полилинейной функцией компонент вектора C = (ci,c2, ... ,ck) £ Rkn, и множество значений {C : a0(C) = 0} имеет меру нуль в Rkn.

Из леммы 5 вытекает, что в принципе вектор C можно выбирать случайным образом. При небольших и средних размерностях систем (1) функцию a0(C) в формуле (20) можно построить явно, используя программы символьных вычислений. Тогда задачу выбора вектора C*, для которого a0(C*) = 0, можно решить таким образом, что матрица A^(x*) из определения 1 имеет хорошую обусловле-ность.

Приведем утверждение о независимости значения кратности от выбора матриц Rj, Sj.

Теорема 3. Если старший коэффициент многочлена (20), где Л(Л) — матрица из (10), является ненулевым для данного набора векторов С = (сі,с2, ..., ск) Є

Ккп,

а сама матрица удовлетворяет ДС, то не существует матриц Бі,

для которых процесс (5) заканчивался бы менее чем за к шагов.

Доказательство. Рассмотрим систему дифференциальных уравнений

М(Б)у(і) = /(і), М0 = 0, Б = а/аі, і Є [0,1], (21)

где матрица М(Л) из леммы 2. Согласно формуле (14) имеет место равенство

V

І(В)М(О)у(і) = В(О)у(і) ¥у{() Є С"+р[0,1], І(Л) = Ц(Е + Ш,). (22)

, = 1

Система (21) сводится заменой переменной к системе первого порядка

А ^ + ВХ = ф, аі

где А, В — матрицы из формулы (13), X = (ут, Бут,... , Бр-1ут)т, ф =

(0, 0,... , /т)т. Ее решение с учетом формулы (12) имеет вид

р і "-1

X(і,с) = 2(і)с + / К(і — з)ф(з)аз + У' К,Б7ф, (23)

0 ,=0

где

2 (і) = д (ехр(—'Л) ^ , К (і — в) = 2 (і — в)Р, К, = 2^{0, N }Р,

0 0,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

с — вектор произвольных постоянных из И,й, 1 = deg М(Л). Из формул (22),

(23) следует, что общее решение системы (21) имеет вид

V-р

у(і,с) = £(і)С +/ К(і — в)/(в)ав + ^ В^ (24)

70 ,=0

где вектор-функция у(£, с) является первыми п компонентами вектор-функции X(£). Допустим, что существуют матрицы Д, >*5^ такие, что оператор ^(Д) =

VI

П№ + ), где VI < V, обладает свойством

7=1

1!(В)М(В)уЩ = В1(Д)у(() УуЩ е С"+р[0,1],

где в операторе В1(Д) = ^р=0 Лр-гВ1;г, det В10 = 0. Все решения системы (21) являются решениями системы В1(Д)у(^) = Ь1(Д)/ и, следовательно, лежат в пространстве С^1-р[0,1]. Если VI < V, то мы получим помимо представления

і

(24) представление с другой гладкостью. Это противоречие доказывает теорему. Действительно, рассмотрим систему

гласно лемме 2 каноническая форма (12) содержит нильпотентный блок N со

Замечание 2. Системы с вырожденной матрицей при старшей производной принято называть дифференциально-алгебраическими уравнениями (ДАУ). Минимально возможный порядок оператора Ь(Б) из (22) называется индексом ДАУ (21). При р =1 индекс пучка равен индексу системы. Если det М0 = 0, то индекс полагается равным нулю. Действие оператора вида Е + ББ, понижает индекс ДАУ ровно на единицу. Обратим внимание на удивительное сходство структуры этого оператора с оператором понижения кратности Е + qj Б, из равенства (9).

Замечание 3. Не любой оператор вида Я, + ББ, понижает индекс ДАУ. Пусть М(Б) = ^Б + Е), где N2 = 0. Индекс равен 2. Подействуем на систему

М(Б)у(і) = /(і) оператором £ = NБ + Е. Получим ДАУ (2N + Е)у(і) = £/(і)

индекса 2. Можно также указать операторы вида (4), не понижающие кратности решений при специальном выборе Дг, Бг или вектора сг.

Укажем еще один случай матриц Дг, Бг, отличных от матриц из процесса

(9) и понижающих кратность решения. В процессе (4), (5) можно принять

где detУ = 0 и число нулевых строк в матрицах УАг(ж*) равно т — гапкАг(ж*). Более того, в условиях теоремы 1 при вычислении матриц Дг, Бг по формулам

в системе (1) являются многочленами от переменных ж1,ж2,... ,жп, то заменами переменных мы всегда можем свести исходную систему к системе, у которой компоненты являются многочленами не выше второй степени:

где Ь — некоторый вектор из И™, С — (т х п)-матрица, Н(ж) =

((Н1ж,ж), (Н2ж,ж),..., (Нтж,ж))т, Н7- — (п х п)-матрицы, ] = 1, 2,... т. Если Ь = 0, то нулевой корень является простым тогда и только тогда, когда гапкС = т.

Например, пусть уравнение имеет вид ж1 = 0. Заменами ж1 = ж2, ж2 = ж3 оно сводится ко второй системе (3). В случае, когда компоненты Б (ж) являются многочленами не выше второй степени, матричный многочлен (19) имеет вид

к

і=0

где А(Л) — матрица из формулы (19). В соответствующем пучке вида (13) со-

свойством N = 0, і > к, и N = 0, і < к.

(25)

(25) через к шагов в (5) получим det Ак+1(ж*) = 0. Ввиду громоздких выкладок мы не будем приводить доказательство.

Отметим еще одно обстоятельство. Если компоненты вектор-функции Б (ж)

Б (ж) = Ь + Сж + Н (ж) = 0,

(26)

пучка матриц Л(Л) = ЛА0(ж*) + A1 и кратность корня ж* совпадает с индексом пучка v. Индекс можно вычислять используя замечание 2. Для второго примера из (3) имеем

/0 1 0\ /10 0\

А(Л) = Л I 0 0 1 I + I 0 1 0 I ,

0 0 0 0 0 1

где принято q1 = (cj, grad), cj = -(1/2,1/2,1/2). Здесь v = 3, так как многочлен Л-7' А (Л) удовлетворяет ДС, начиная с j > 2.

Кратность не инвариантна к заменам, сводящим исходную систему к системе, у которой компоненты являются многочленами не выше второй степени, и пока не установлена формула, связывающая исходную кратность решения с кратностью решения системы после замены.

3. Сравнение понятий кратности

Обсудим некоторые известные подходы к определению количественных характеристик кратности и сделаем сопоставления. Вначале коснемся связи введенных понятий с классическим понятием кратности, используемым в алгебраической геометрии. В общем случае кратность определяется как размерность некоторой локальной алгебры отображения Е в нуле [13, с. 66; 14, с. 268]. При определенных предположениях кратность можно вычислить как степень отображения некоторой малой сферы в сферу той же размерности [13, с. 75]. В силу сложности этих процедур установить прямые связи между классическим и нашим определениями в прямой форме не получается. Их можно лишь сравнить на эталонных отображениях. Для этого выберем отображение Фама

Е (х) = (хГ )Т (27)

В книге [13, с. 75] показано, что малой деформацией отображения (27) можно получить любой конечнократный росток. Кратность (индекс) в алгебраической геометрии отображения (27) равна произведению т4т2 ... тп, а левая и правая кратности равны шах{т-, ] = 1, 2,...,п}. Раскроем при г = к произведение операторов из формул (5):

Я -И+.?2+--

... ^2^1 = / - — - -— , (28)

к к 2 1 л-2,...,:?п Г) Ло 72 О -п ’ ' 1

. . . . . . . . дХп

0<Л+72+---+7п<к 1 2

где Ь-1)7-2)...)7п — (т х т)-матрицы, возникающие при собирании производных одинакового порядка, и (ж) = Ек(ж). В частности для отображения (27) можно

принять

Ьт-1 = ^{З™1-1/^1-1,З™2-1/^2-1,..., д^-1/^1-1} , (29)

где т = шах{т-, ] = 1, 2,... , п}. Из формулы (29) мы видим, что старшие степени операторов дифференцирования дают информацию о степенях переменных ж- в отображении Фама. Возникает интересная задача о вычислении степеней в

отображении Фама, соответствующем отображению у = Е(ж), по старшим степеням операторов дифференцирования в формуле (28).

Рассмотрим проблему определения характера критической точки функции Е(ж). Пусть Е : И” --- И и мы каким-то способом решили уравнение

Ф(ж) = gradЕ (ж) = 0. (30)

Реализуется ли в точке ж*, в которой Ф(ж*) = 0, локальный минимум (максимум), либо она является точкой перегиба, например, седловой? Если решение ж* кратное, то методы, основанные на исследовании положительности (отрицательности) матрицы ||д2Е(ж)/джЗж-1|”.,=1 в точке ж*, не работают. В настоящее время сформировалось такое предположение.

Гипотеза. Если точка ж* являлется решением системы (30), в ней достигается локальный минимум функции Е(ж) и определена левая кратность решения, то она является нечетным числом.

В подтверждение гипотезы приведем пример, когда это так. Пусть нуль является решением системы (30) и в окрестности нуля существует замена ж = фг, det ф = 0, г = (г1, г2,..., )Т, со свойством

П

Е (фг ) = ао + £] —+1, (31)

- =1

где а — некоторая константа, т- — нечетные целые числа. Элементарные вычисления показывают, что левая кратность нуля (решения соответствующей системы Ф(ж) = 0) здесь является нечетной. Система gradF(z) = 0, Ё(г) = Е(фг) является отображением Фама, и легко видеть, что нечетность левой кратности решения является только необходимым условием локального минимума. Локальный минимум в нуле достигается в нуле тогда и только тогда, когда произведение т1т2 ... тп является нечетным числом.

Свои методики определения кратности складываются у вычислителей. Влияние кратности на численные процессы при решении систем вида (1) впервые исследовалось, по-видимому, в работах ИаИ’а (см., например, [15]), но на системы там накладывается серьезное ограничение: ж* является изолированной точкой, в которой функция det А0(ж) обращается в нуль. Иначе говоря, det А0(ж) = 0 при всех ж = ж* из некоторой окрестности точки ж*. Легко убедиться, что для примеров (3) это не так. Иногда для определения кратности используют значения ранга (коранг) матрицы А0(ж*). Если снова обратиться к системам (3), то видим, что у первой системы гапкА0(ж*) = 0 при любом ] > 1, а у второй гапкА0(ж*) = 2.

В настоящее время большое развитие получили подходы, изложенные в монографиях [3; 4], основанные на понятии 2-регулярности (р-регулярности) нелинейных задач [4, с. 39]. Пусть Е : X — У, где X, У — линейные нормированные пространства, Е(ж*) = 0, ж* € X, и определено линейное отображение Ф(Р, Л) = Е'(ж*) + РЕ''(ж*)[Л] : X — У, где ' , '' — первая и вторая производные, Р — проектор на У2 вдоль У1 = тЕ'(ж*), а У2 — его прямое дополнение. Тогда отображение Е является 2-регулярным в точке ж* на элементе Л € X, если оператор Ф(Р, Л) сюрьективен. Отсюда следует, что при X = И”, У = Ит оператор

Ф(Р, Л) — (т х п)-матрица, гапкФ(Р, Л) = т и это определение эквивалентно правой кратности к = 2. Используя специальную запись (кортежи) ряда Тейлора, даются определения регулярности более высоких порядков [6].

4. Поведение метода Ньютона в случае кратных решений

Известно (см. например, [1, с. 136]), что последовательность вида

жЬ'+і] = - [Ао(жь'])]-1Е(жь']), з = 0,1,... , (32)

в случае простого корня сходится к решению ж* с квадратичной скоростью сходимости:

цжЬ'+1] _ ж*|| < с||жЬ1 _ ж*||2

при достаточно малом значении величины ||ж[0] — ж*||, где з — номер итерации, с — некоторое число. Для одномерного случая известна оценка |ж[^+1] — ж*|| < дЦж^'1 — ж*||, где q = (к — 1)/к.

При п > 1 ситуация гораздо сложнее. Установить зависимости между кратностью и сходимостью удалось установить только для некоторых частных случаев. Пусть в системе (26) Ь = 0 и

РС^г + РН(^г) = (^2 — г2 = 0, — ^2 = 0, ... , 2П — гП— = 0, = 0)т, (33)

где Р, ^ — постоянные неособенные матрицы, ж = фг. Частным случаем такой системы является вторая система (3) при п = 3. Здесь матрица Л(Л) = ЛХ + Еп, построенная по формуле (19), где г* = 0, с = (—1/2, —1/2,..., —1/2)т, матрица N — "жорданов ящик" с нулевым собственным числом. Согласно теореме 1 кратность решения г* = 0 равна п + 1.

Применим к системе (33) метод (32). После ряда преобразований мы получим итерационный процесс

г1?+1] = г1?]/2 + г2?']/4г1?'] — гЭ?']/(8г1?']г27']) + ■ ■ ■ + (—1)гагП11/(2гаг^]4'7'] ... гЩ1);

’21 = г”—2/2 + г”-1/4г”—2 - г”’]/(8г”—2г”—^;

7Ь'+1] = ~’ /2 + -[’] /4 7[’] ;

гга—1 гга—1/2 + гга /4гга—1;

г'-’+Ч = -?/2. (34)

Лемма 6. Существует такое многообразие {г : М(г) = 0} С И”-, что при г[0] = (-1°], г2°], • • • ,г«])Т ^ {- : М(г) = 0} для процесса (34) справедливы равенства

г’] = (0*)’4°], г = 1, 2, • • •, п, где |0*| = (1/2)««, £(г) = 1/2”-*.

Более того, если г[0] = (-1°], -2°], • • • , г«])Т ^ {- : М(г) = 0}, то имеют место соотношения

Доказательство. Очевидно, что для последней компоненты в (34) имеем 6П = 1/2, = (1/2)Щг]0. Из (34) следует, что

^-,/2 + 4"(1/2)’/4^

Полагая гЩ, = $П_ 1г|1°11, 6га-1 = (±1/л/2), получаем необходимую связь между начальными данными 2(г,[°11)2(±\/2 — 1) — г|°] = 0 (компоненту вектор-функции М(г)). Дальнейшие рассуждения очевидны.

Докажем соотношения |^щ — 6^| —> 0, ] — то, для случая, когда начальные данные процесса (34) не лежат на нужном многообразии. Для определенности пусть 6п-1 = (1/^). Произведем замену гЩ1 = (\^2)Щ0. Получим последовательность

Сщ+1 = (^2/2)0 + гП°]/4Сщ •

Неподвижная точка отображения £ = -0(£) = (^/2/2)£ + г]°]/4£ здесь определяется из равенства £2(1 — л/2/2) = г]°] /4. Производная ^0(£)/^£ в неподвижной точке не зависит от начальных данных. Ее модуль равен числу |\/2 — 1| < 1. Дальнейшие рассуждения аналогичны. □

Для исходной системы (26) скорость сходимости метода Ньютона при сделанных предположениях определяется величиной 61. В общем случае скорость сходимости зависит для систем (26) от сочетания индексов пучков матриц ЛС + Ащ, где Ащ = дА°(ж)/дЖщ, ] = 1, 2,... , п, А°(ж) = С + дН(ж)/дж. Рассмотрен ряд случаев при п = 2, 3. Оказалось, что константы, определяющие скорость сходимости, являются корнями некоторых квадратных и кубических уравнений соответственно.

Для произвольных систем вида (1) ситуация еще сложнее. Рассмотрим пример, указанный профессором Л.Бап^ом:

Е(ж) = (Хт — 4 = 0, ж^ = 0)т, где т, / , к — натуральные. Применяя (32), получим итерационный процесс ХЩ+1] = Щ /Х[(т-1)Щ] Х[Щ + 1] =

х 1 — [лЛ; 1 ~г 1-/2 / ^-'1 ) ^2 — гь^2 ^

где / = (т — 1)/т, к = (к — 1)/к, V = (к — /)/кш. Если начальные данные

удовлетворяют условию (ж1°])т(р — /) = V(ж2°])г, р = к1/т (принадлежат аналогу

многообразия из леммы 6), то мы формально получаем сходимость по первой

компоненте в виде геометрической прогрессии жЩ+1] = ж1°]рЩ, р = к1/т. Но эти

последовательности не всегда являются устойчивыми. В частности, если //р > 1,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[?+1] [?]

устойчивой является другая последовательность вида ж1 = /ж1 . Это было

выявлено при численных экспериментах.

Подчеркнем, что в работе не ставился вопрос о восстановлении квадратичной сходимости. По этому вопросу есть обширная литература (см. например, [5]).

Заключение

Исследования, результаты которых изложены выше, проведены для решения проблем, возникших при изучении нелинейных ДАУ

С(^у,у) = АуС0 + /(уС0,:0 = 0 * е [—1,l], (35)

где А — (п х п)-матрица, / : Ип х [—1,1] — И”,у(*;) — искомая вектор-функция,

' = ^/^*. Предполагается, что А = 0 и входные данные обладают достаточной

гладкостью. ДАУ (35) ставится в соответствие г-продолженная система

^^у^ dG(t,y,y)M, •••, = ву,•••,у(г+1)) = 0 (36)

и допускается, что в окрестности некоторой точки из К(г+2)га+1, удовлетворяющей уравнению

в(0, с°, С1, • • • ,ст) = 0,

начиная с некоторого г = к, определено гладкое неособенное преобразование Ш системы (36) со свойством

Ш ◦ в(«, у, у, • • •, у(‘+1)у) =

= { у + ЛЫ), й(«,у, у, • • • ,у(*+1)), /2(у,*)} = 0, (37)

Из соотношений (37) можно выделить две подсистемы:

у + /1(у,*) = °, /2(у,*) = 0,

определяющие многообразие решений системы (35). Число к называется индексом ДАУ (35). В частности, если выполнены условия

гапкА = гапк(А|/(с°, 0)), с° € И”-, гапкА = degdet[ЛA + д/(с°, 0)/ду], (38)

то к =1: оператор Е + (^/^*) [Е — АА-] сводит систему (35) к системе с невырожденной матрицей в некоторой окрестности точки (с°, 0) при производной. Более того, на некотором отрезке (—е, е), е > 0, определено единственное решение системы (35) со свойством у(0) = с° [16]. Но такой подход реализуем не всегда. Например, пусть ДАУ (35) имеет вид

у(0 + ..2Т.2 = 0, уі(0) = у?(0) = 1. (39)

Здесь уі(і) = Уг(і) = 2/(2 — і) и других решений нет. Легко проверить, что при любом і гладкого преобразования Ш для продолженной системы (39) не существует. Рассмотрим произведение

1 Л у +(уіу2

2 2 У + І»? + у?

11 у+ит— У? =0- (40)

О

где а = ci,i — ci,2. Новая система (40) удовлетворяет условиям (38), если а = 0. Иначе говоря, система (39) имеет индекс 1, а ее решение — кратность 2.

Таким образом, важной частью анализа ДАУ (35) является построение регулярной процедуры, сводящей исходную систему к системе, для которой из соответствующей i-продолженной системы можно гладким преобразованием выделить систему в нормальной форме, на основе понятий кратности решений нелинейных систем.

Список литературы

1. Красносельский, М. А. Приближенное решение операторных уравнений /

М. А. Красносельский, Г. М. Вайникко, П. П. Забрейко , Я. Б. Рутицкий, В. Я. Стеценко.— M. : Наука, 1969.

2. Ортега, Дж. Итерационные методы решения нелинейных систем уравнений со многими неизвестными / Дж. Ортега, В. Рейнболдт.— М. : Мир, 1975.

3. Арутюнов, А. В. Условия экстремума. Анормальные и вырожденные задачи /

А. В. Арутюнов.— М. : Факториал, 1997.

4. Измаилов, А. Ф. 2-регулярные решения нелинейных задач / А. Ф. Измаилов,

A. А. Третьяков.— М. : Физматлит, 1999.

5. Брежнева, О. А. О построении определяющих систем для отыскания особых решений нелинейных уравнений / О. А. Брежнева, А. Ф. Измаилов // ЖВММФ.— 2002.— Т. 42, № 1.— C. 10—22.

6. Брежнева, О. А. Теория р-регулярности и малого параметра Пуанкаре / О. А. Брежнева, Ю. Г. Евтушенко, А. А. Третьяков // Докл. РАН.— 2006.— Т. 411, № 6.— C. 727—731.

7. Bulatov, M. V. On multiple solutions nonlinear equations / M. V. Bulatov, V. F. Chistykov // Вычислительные технологии и Вестник КазНУ им. Аль-Фараби. Сер. Математика, механика, информатика : совместн. вып. по материалам меж-дунар. конф. "Вычислительные и информационные технологии в науке, технике и образовании". (7—9 окт.) 2004. Ч. I, т. 9. C. 22—29.

8. Бояринцев, Ю. Е. Регулярные и сингулярные системы линейных обыкновенных дифференциальных уравнений / Ю. Е. Бояринцев.— Новосибирск : Наука, 1980.

9. Марчук, Г. И. Повышение точности разностных схем / Г. И. Марчук,

B. В. Шайдуров.— М. : Наука, 1979.

10. Гантмахер, Ф. Р. Теория матриц / Ф. Р. Гантмахер.— M. : Наука, 1967.

11. Булатов, М. В. Редукция вырожденных систем интегральных уравнений типа Вольтерра к невырожденным / М. В. Булатов // Изв. вузов. Математика.— 1998.— № 11 (438). С. 14—21.

12. Булатов, М. В. О преобразовании алгебро-дифференциальных систем уравнений / М. В. Булатов // ЖВММФ.— 1994.— Т. 34, № 3.— С. 360—372.

13. Арнольд, В. И. Особенности дифференцируемых отображений / В. И. Арнольд, А. Н. Варченко, С. М. Гусейн-Заде.— М. : МЦНМО, 2004.

14. Ш^афаревич, И. Р. . Основы алгебраической геометрии : в 2 т. Т. 1. Алгебраические многообразия в проективном пространстве / И. Р. Шафаревич.— М. : Наука, 1988.

15. Rall, L. Convergence of the process to multiple solutions / L. Rail // Numer. Math.— 1966.— Vol. 9.— P. 33—37.

16. Чистяков, В.Ф. Алгебро-дифференциальные операторы с конечномерным ядром /В. Ф. Чистяков.— Новосибирск: Наука, 1996.

i Надоели баннеры? Вы всегда можете отключить рекламу.