Вычислительные технологии
Том 6, № 4, 2001
КРИТЕРИЙ ПОСТОЯНСТВА ПУЧКА КОМПЛЕКСНЫХ МНОГОЧЛЕНОВ И ОБОБЩЕНИЕ "АЛЬТЕРНАТИВНОГО" ПРИЗНАКА
__U __, _
ИХ УСТОЙЧИВОСТИ (К ВОПРОСУ О МОДИФИКАЦИИ АЛГОРИТМА РАУСА)
В. А. ДАНИЛОВ Институт динамики систем и теории управления СО РАН
Иркутск, Россия e-mail: danilov@icc.ru
The so-called "alternative formulation" is generalized. With the help of this formulation the problem on stability of the given real algebraic polynomial is reduced to the same problem on a polynomial of a lower degree. "The new formulation" for the case of complex polynomial with arbitrary location of the roots is offered. Hence the possibility to modify and to simplify Routh algorithm is appeared.
При решении задачи на устойчивость (по Гурвицу [1, 2]) или, другими словами, при проверке гурвицевости [3] какого-нибудь алгебраического многочлена
P (x) = aoxn +-----+ a,n (1)
с положительными коэффициентами ао, ... , an можно воспользоваться так называемой альтернативной формулировкой [4, с. 39]: все корни многочлена P расположены слева от мнимой оси в комплексной плоскости (имеют отрицательную вещественную часть) тогда и только тогда, когда то же самое справедливо для всех корней многочлена
aixn-1 + (a2 - qa3)xn-2 + a3xn-3 + (a4 - qa5)xn-4 +-----+ an, (2)
где q = a0/a1. (Таким образом, устойчивость многочлена P определяется через устойчивость многочлена меньшей степени.)
Чтобы альтернативная формулировка была справедливой, не обязательно указывать на положительность (знакопостоянство) всех вещественных коэффициентов многочлена P (хорошо известное необходимое условие устойчивости). Достаточно иметь неравенство
a0a1 > 0. (3)
Известный алгоритм Рауса [1], с помощью которого иногда легко выясняется число корней вещественного многочлена P степени n как слева, так и справа от мнимой оси, в частности, позволяет сделать вывод о справедливости следующей теоремы.
© В. А. Данилов, 2001.
Теорема 1 (уточненная альтернативная формулировка). Вещественный многочлен Р вида (1) с условием (3) устойчив (по Гуpвицу) тогда и только тогда, когда устойчив многочлен (2).
Замечание 1. Пусть п =1, тогда в теореме 1 речь идет об устойчивом вещественном биноме Р = а0х + а1. При этом многочлен (2) является ненулевым мономом а1 — многочленом нулевой степени. Здесь такие многочлены-константы, как и многочлены, не имеющие корней, по крайней мере, на мнимой оси и справа от нее, естественно, называются устойчивыми. Таким образом, справедливость теоремы при п =1 очевидна.
Соотношение (3) является необходимым условием устойчивости вещественного многочлена Р. Более того, вещественность коэффициентов а0 = 0, а1 и устойчивость многочлена Р вида (1) влекут за собой соотношение (3) даже в том случае, когда другие коэффициенты многочлена, возможно, оказались комплексными, так как число —а1/ао есть сумма всех корней многочлена с учетом их кратностей (суммы всех произведений каждого корня на его кратность) и в силу устойчивости должна быть отрицательной. Поэтому частично (в одну сторону) "формулировка" и теорема 1 справедливы без дополнительных условий, таких как соотношение (3): если дана устойчивость вещественного многочлена (1), то и многочлен (2) устойчив. (Отметим, что случай д = 0, когда (3) не соблюдается, означает совпадение многочленов Р и (2).)
Что касается неустойчивых многочленов Р и (2), "стандартные" шаги того же алгоритма Рауса позволяют сделать предположение о справедливости обобщения теоремы 1, которое можно было бы назвать обобщенной альтернативной формулировкой: при соблюдении соотношения (3) у каждого из многочленов Р и (2) количество всех корней справа от мнимой оси одно и то же (см. ниже теорему 5).
Поскольку обоснование даже в простейшем случае всего лишь одного какого-нибудь шага алгоритма Рауса представляется весьма непростым делом, возникает желание найти более простое доказательство указанных "формулировок". В связи с этим (и по некоторым другим причинам, которые будут видны далее) в настоящей статье предлагается новый и достаточно простой метод их доказательства. Он распространяется на случай многочленов с комплексными коэффициентами, а также существенно дополняет известную теорему Шура [2] об устойчивости комплексных многочленов, что позволяет в свою очередь построить алгоритм для проверки на устойчивость любого алгебраического многочлена с комплексными коэффициентами, не уступающий известной схеме Рауса по наглядности и простоте.
Чтобы доказать предлагаемые утверждения (обобщить теорему 1) и наметить пути модификации алгоритма Рауса, вводятся ключевое понятие пучка многочленов Р + rQ, где Р, Q — заданные многочлены; г — числовой параметр (в статье [5] такое понятие неявно используется), а также понятие постоянного пучка. Выясняются некоторые во многих случаях легко проверяемые условия постоянства пучков, что в итоге приводит к ожидаемым обобщениям (см. ниже теоремы 3, 5) и некоторым неожиданным результатам (см. ниже пример 3). Представление корней многочленов в виде непрерывных функций параметра г в заранее заданном промежутке (интервале) вещественных чисел, которое используется в [3, 5], здесь не обеспечивает простых доказательств всех предлагаемых утверждений. Многие известные результаты относительно непрерывности корней [6, п. 11; 7, приложение Д имеют лишь локальный характер и в данном случае оказываются недостаточными. Заметим, что классические факты теории функций комплексного переменного, как, например, теорема Руше [8, с. 246], здесь достаточны для того, чтобы достичь цели.
Некоторые новые результаты, полученные автором и примененные к обобщению и уси-
лению известных, сами по себе имеют практическое значение, и их можно, кроме всего прочего, использовать при машинном воплощении того или иного алгоритма проверки на устойчивость, чтобы избежать больших вычислительных погрешностей (см. ниже пример 4).
1. Понятия сдвига, сpезки многочлена и несколько новых альтернативных формулировок
В настоящей статье п обозначает некоторое фиксированное положительное целое (натуральное) число п > 1 (при п = 0 формула (2) теряет смысл). Исключением можно считать лишь определение 1, где допускается нулевая степень многочлена Р (п = 0). В связи с этим сделаем
Замечание 2: а) будем предполагать, что и в том случае, когда многочлен Р задается формулой (1), его степень может отличаться от п (допускаем случай а0 = 0);
б) в зависимости от ситуации будем либо непосредственно указывать на степень многочлена, например deg(P) = к, либо обозначать ее с помощью нижнего индекса: Р& — многочлен степени к (при к = п имеем а0 = 0);
в) формулу (1) иногда целесообразно рассматривать как определение множества комплексных многочленов, содержащего только те многочлены Р, у которых deg(P) < п, а также нулевой (Р& вне этого множества, если к > п);
г) часто будем пользоваться обозначением многочлена упрощенно: без каких-либо индексов (в частности, без указания на его степень), если это не приведет к путанице.
Определение 1. Многочлен Р вида (1), у которого Яе(а0) = 1, (в частности, Р = хп + ...) называется квазинормализованным (нормализованным [9, с. 220], если а0 = 1).
Допуская произвольные комплексные многочлены, введем для них несколько общих определений, используя при этом уже известные понятия относительно расположения их корней. Что касается расположения корней какого-либо многочлена относительно некоторой заданной области комплексной плоскости, как обычно, каждый корень, попавший в эту область, будет учитываться вместе с его кратностью. Все такие кратности суммируются столько раз, сколько обнаружится корней в данной области. В итоге именно эту сумму называют числом (количеством) всех корней многочлена (с учтенной кратностью), попавших в данную область.
Естественно, нулевое число корней означает отсутствие таковых.
Определение 2. Многочлен называется регулярным [1, с. 473], если у него нет корней на мнимой оси. В противном случае он будет называться особенным или критическим.
Определение 3. Пусть дан многочлен Р. Число всех его корней, расположенных справа от мнимой оси (с положительной вещественной частью), назовем его сдвигом (вправо) и будем обозначать через ^(Р). При этом многочлен Р называется:
а) Ь-сдвинутым, если ^(Р) = Ь;
б) несдвинутым (нуль-сдвинутым), если в(Р) = 0;
в) вполне сдвинутым, когда ^(Р) = deg(P).
Таким образом, число Ь > 0 (положительный сдвиг) Ь-сдвинутого многочлена является неким показателем его неустойчивости. Очевидно, имеет место соотношение з(Р) < deg(P).
Несдвинутый многочлен (подобно устойчивому) не имеет корней справа от мнимой оси (всякое число х с положительной вещественной частью Де(х) > 0 не является корнем любого такого многочлена), но допускается наличие у него корней на мнимой оси (несдвинутый многочлен может быть и особенным, критическим).
Известное понятие устойчивости многочлена (по Гурвицу) можно кратко изложить заново (учитывая при этом многочлены нулевой степени) и заодно ввести понятие почти устойчивости.
Определение 4. Иесдвинутый регулярный (особенный) многочлен называется устойчивым (почти устойчивым). Соответственно Ь-сдвинутый многочлен, когда Ь > 0, будет называться (упрощенно) сдвинутым или неустойчивым.
Замечание 3: а) ясно, что любой многочлен нулевой степени по определению 4 является устойчивым (см. Замечание 1);
б) сдвинутые неустойчивые биномы х — 1 (п = 1) и х2 — х (п = 2) по формуле (2) превращаются соответственно в устойчивый и почти устойчивый мономы —1 и — х, поэтому согласно определению 4, чтобы распространить и обобщить альтернативную формулировку [4, с. 39] на случай несдвинутых многочленов (устойчивости или почти устойчивости) уже при п =1, 2 необходимо дополнительное условие, как, например, (3).
Определение 5. Многочлен РЛ называется отражением (отраженным от) многочлена Р, если имеет место тождество РЛ(х) = Р(—х).
Очевидны следующие свойства отражения: (РЛ)Л = Р, (хР)Л = —хРЛ, (Р^)Л = РЛQЛ, (гР)Л = гРЛ, где г — некоторое число.
Как некий очевидный признак устойчивости предлагается следующая
Теорема 2. Многочлен Р устойчив в том и только в том случае, когда отражение РЛ вполне сдвинуто.
Определение 6. Пусть к — некоторое заданное целое число, тогда для любого (вещественного) многочлена Р его к-срезкой или срезкой порядка к называется многочлен
{кР} = (Р — (—1)к Р Л)/2. (4)
Здесь, по сути дела, определены лишь две "срезки" в зависимости от четности к: 0-срезка (при четных к) и 1-срезка (при нечетных). (Многочлены {0Р}, {:Р} известны [1, 2] как вспомогательные, которые иногда используются для сугубо технических нужд. Здесь они будут играть в теоретическом плане более важную роль.)
Далее п-срезку (к = п) будем обозначать упрощенно (без индексов) через {Р} и называть такой многочлен попросту срезкой. В таком случае, рассматривая некий многочлен Р вида (1), имеем либо {Р} = 0 (например, {хп} = 0), либо deg{P} < п (к примеру, deg{xra + хп-1} = deg{xra-1} = п — 1).
Более того, имеет место формула
{Р} (х) = а^-1 + азга-3 + ...
Таким образом, срезка остается во множестве (1) и в качестве многочлена вида (1) имеет нулевые коэффициенты с четными индексами (в частности, если п = 1, 2, то {Р} = а1, а1х соответственно).
Замечание 4: а) каковы бы ни были заданные целое число к и многочлен Р с некоторой степенью имеет место одно из двух равенств: либо {Р} = {кР} (при четном ] — к), либо {^+1Р} = {кР} (при нечетном);
б) когда deg(P) = ] = 0 и к — четное, имеет место очевидное равенство {0Р} = {к р} = 0, поэтому такой случай в дальнейшем будет заранее исключаться из рассуждений как несущественный (или, возможно, бессмысленный);
в) учитывая предыдущие замечания а и б при заданном Р вида (1), п-срезку {Р} будем рассматривать лишь в двух случаях: п = ] > 0) или п = ] + 1, что означает, по сути дела, ограничение п > deg(P) > п — 1 (т. е. случай а0 = а1 = 0 исключается), чем и будем пользоваться во многих случаях ради удобства и наглядности в рассуждениях, не теряя при этом общности;
г) согласно замечанию 2, в и свойству срезки множество (1) вместе с вещественным многочленом Р содержит в себе семейство многочленов Р + гх{Р}, г € К = (—то, то), среди которых при определенном г = —д = —а0/а1 обнаруживается многочлен (2);
д) учитывая замечания б, в, отметим, что соотношение deg(P + гх{Р}) < deg(P) = п или равенство deg(P + гх{Р}) = п — 1 справедливы только в том случае, когда г = —д = —а0/аь
Легко проверяются формулы
{Р + Q} = {Р} + М, {гР} = г{Р},
{Р} + (—1)п{Р }л = 0, (5)
{х{Р}} = 0, (6)
{Р + гх{Р}} = {Р}, (7)
где Р, Q — любые многочлены (произвольной степени); г — любое вещественное число. (Согласно определениям 5 и 6 равенство (6) непосредственно получается из (5):
2{х{Р}} = х{Р} — (—1)п(х{Р })л = х({Р} + (—1)п{Р }л).)
В следующих вспомогательных утверждениях отмечены менее очевидные свойства срезки особенного (критического) многочлена.
Лемма 1. Пусть Р(т) = 0, где Р — вещественный многочлен, а число т — "чисто" мнимое (т = —т). Тогда Рл(т) = {Р}(т) = 0.
Доказательство. С учетом вещественности коэффициентов многочлена Р и свойства мнимого числа (сопряженное т равно противоположному —т) согласно определениям 5 и 6 получается:
Рл(т) = Р(т) = Р(т) = 0, 2{Р}(т) = Р(т) — (—1)пРл(т) = 0.
Лемма 2 (об общем делителе многочлена и его срезки). Для любого вещественного многочлена Р = 0 найдутся такие вещественные многочлены М и регулярный Q, а также некоторое целое к > 0, что будут иметь место два равенства: Р = хкMQ, {Р} = хк м {п+к Q}.
Доказательство. Если М = Мл, то второе равенство, предлагаемое в лемме 2, вытекает из первого:
{Р} = (хкMQ — (—1)п(—х)кМлQл)/2 = хкМ(Q — (—1)п+кQл)/2 = хкМ{п+кQ} .
Докажем существование первого равенства Р = хк MQ с дополнительным условием М = Мл по индукции относительно степени заданного многочлена Р.
В случае регулярности Р, в частности когда deg(P) = 0, утверждение очевидно: к = 0, М = 1, Р = Q.
Пусть дан особенный вещественный многочлен Р = 0. Сделаем индукционное предположение: лемма 2 справедлива для любого многочлена степени меньшей, чем deg(P).
Если существует мнимый корень т = 0 у данного многочлена, то у него есть и другой (противоположный и тоже мнимый) т = —т. Поэтому Р = (х — т)(х + т)Б = (х2 — т2)Б, где Б = 0 — некий вещественный многочлен меньшей степени: deg(Б) < deg(P). По индукционному предположению Б = хкЬQ, где Ь = ЬЛ и Q — регулярный. Тогда Р = хкMQ, где М = (х2 — т2)Ь = МЛ, что и требуется для индукционного шага. Если же любое мнимое число т = 0 не является корнем, тогда имеет место очевидное: Р = хкQ, где Q — регулярный (М = 1 ).
Таким образом, индукционный шаг сделан и лемма 2 доказана.
Учитывая определения 4 и 6, теорему 1 легко представить по-другому (переформулировать) и заодно охватить случай почти устойчивых многочленов (обобщить "альтернативную формулировку" на случай несдвинутых многочленов).
Теорема 3 (новая альтернативная формулировка). Пусть даны многочлен Р вида (1) и положительное число
q = а0/а1 > 0 . (8)
Тогда, если один из двух многочленов Р или Р — дх{Р} (почти) устойчив, то таков же и другой.
Теорема 3 сформулирована на основе двух следующих теорем для вещественных многочленов.
Теорема 4 (альтернатива регулярности). При любом вещественном q, если один из двух многочленов Р или Р — qx{P} регулярен, то таков же и другой.
Доказательство. Пусть Q = Р — qx{P} регулярен, но Р — особенный: Р(т) = 0, где т — некоторое мнимое (Ле(т) = 0). Тогда {Р}(т) = 0 согласно лемме 1. Следовательно, и многочлен Q — тоже особенный: Q(m) = 0 (с тем же мнимым корнем т).
Обратное докажем также от противного: предположим, что Р регулярен, но при каком-то мнимом т имеем Q(m) = 0. Тогда в силу леммы 1 и формулы (7) имеют место равенства Q(m) = Ш}(т) = {Р}(т) = 0. В итоге Р(т) = 0.
Таким образом, в обоих случаях возникает противоречие с условием о регулярности одного из многочленов, что и доказывает теорему 4.
Теорема 5 (альтернативная формулировка о сдвигах). В условиях теоремы 3 имеет, место равенство
в(Р) = з(Р — qx{P}).
Замечание 5: а) ясно, что теорема 5 в случае несдвинутых многочленов является следствием теоремы 3;
б) учитывая замечание 4 д, число q во всех предыдущих утверждениях можно было бы вводить неявным образом: q > 0 такое, при котором deg(P — qx{P}) < deg(P); такое введение числа q, не привлекая формулу (8), предпочтительнее (чем в дальнейшем и будем пользоваться), поскольку в случае комплексных многочленов для q нужна другая формула (см. далее замечание 7, а).
Доказательство теоремы 5 дается в разделе 2 с помощью утверждений относительно некоторого семейства (пучка) многочленов Р + ^ (в частности, когда Q = х{Р}), г € Д С Л, где Д — некий промежуток вещественных чисел: интервал, отрезок или полуинтервал (не пустое, возможно неограниченное, множество).
Определение 7. Семейство многочленов Р + ^ со значениями параметра г в промежутке О будет называться пучком на О или просто пучком с обозначением его в виде упорядоченной тройки [Р, Q; О].
Чтобы сформулировать комплексный аналог теоремы 5, введем понятие сопряженной срезки комплексного многочлена Р аналогично определению 6. Для этого воспользуемся [2] сопряженным многочленом Р- = а0хп + ... + ап, чтобы определить соответствующее сопряженное отражение: Р~ = (Р-)л = (Рл)-.
Определение 8. Сопряженной срезкой многочлена Р назовем многочлен
{Р} = (Р — (—1)пР~)/2. (4~)
Замечание 6. Если Р — вещественный, то Р~ = Рл и, следовательно, его сопряженная срезка совпадает с его прежней, поэтому оставляем то же обозначение и будем пользоваться тем же сокращенным названием срезка.
Срезка комплексного многочлена Р вида (1) может иметь степень п. Более того, если
{Р} = Ь0хп + Ь1хп-1 + Ь2хп-2 ..., (9)
то имеем
Ь0 = (а0 — «0)/2, Ь1 = (а1 + а1)/2 = Ке(а1), Ь2 = (а2 — а2)/2 . (10)
Теперь теорема 4 в том же виде распространяется на комплексный случай, если справедливы комплексный аналог леммы 1 и (буквально) та же формула (7).
Учитывая замечание 5, б к теореме 5, можно сформулировать обобщение регулярного варианта этой теоремы на случай комплексных многочленов:
Теорема 6 (комплексный аналог теоремы 5). Пусть дан регулярный комплексный многочлен Р и нашлось число д > 0, при котором deg(P — дх{Р}) < deg(P). Тогда ^(Р) = в(Р — дх{Р}).
Замечание 7: а) для многочлена Р вида (1) со степенью п условие deg(P — дх{Р}) < deg(P) означает deg{P} = п—1, что согласно формулам (9), (10) имеет место только тогда, когда многочлен Р имеет вещественный старший коэффициент и при этом а0 = дЬ1 = 0, т. е.
д = а0/Ке(а1) = а0/Ь1.
Если же deg(P) = п — 1 > 0, неравенство deg(P — дх{Р}) < deg(P) возможно только в том случае, когда deg{P} = п — 2, т.е. когда Ь1 = Ке(а1) = 0 и при этом а1 = дЬ2 = д(а2 — а2)/2 = 0 — мнимое число. Рассматривая многочлен М = Р/г, где г — мнимая единица, возвращаемся согласно равенству г(М — дх{п-1М}) = Р — дх{Р} к предыдущему случаю, когда порядок п — 1 срезки совпадает со степенью многочлена М, у которого старший коэффициент а1/г — вещественный;
б) во многих случаях легко обосновать аналог леммы 2 для комплексных многочленов, поэтому условие регулярности многочлена Р в теореме 6, как и в теореме 5, возможно, является необязательным (хотя при доказательстве поначалу рассматривается регулярный случай).
2. Пучки комплексных многочленов и некоторые кpитеpии их постоянства
Здесь всюду рассматриваются комплексные многочлены Р, Q, если не будет каких-нибудь дополнительных ограничений. (В отдельных случаях параметр г может принимать комплексные значения.)
В дальнейшем, если задан пучок [Р, Q; О], будет удобно иметь дело с функцией р: О ^ Д, определяемой по формуле р(г) = з(Р + гQ), г € О. Такую функцию будем называть функцией сдвига пучка [Р, Q; О].
Определение 9. Пучок [Р, Q; О] называется:
а) регулярным (на О), если при каждом значении параметра г, взятом из О, многочлен Р + ^ является регулярным;
б) правильным, если все его многочлены имеют одну и ту же степень;
в) постоянным, если его функция сдвига р постоянна на О.
Замечание 8. В дальнейшем |х| и |Р| будут обозначать соответственно модуль числа х (абсолютную величину числа) и функцию со значениями |Р(х)|.
Лемма 3. Пусть даны регулярный многочлен Р степени п и некий многочлен Q степени к, и при этом п < к. Тогда существует такой интервал Н = (—к, к), что все значения функции сдвига р пучка [Р, Q; Н] удовлетворяют неравенствам р(0) < р(г) < р(0) + к — п.
Доказательство. Поскольку многочлен Р — регулярный, существует такое а > 0, что все значения многочлена Р на мнимой оси по модулю ограничены снизу числом а
(|РI > а).
Теперь зафиксируем такую окружность с центром в нуле, чтобы вне образованного ею круга К не было корней многочлена Р и, более того, чтобы на выбранной окружности, как и на мнимой оси, соблюдалось неравенство | Р| > а. Такая окружность для ненулевого многочлена Р естественно найдется. В свою очередь, для многочлена Q на круге К найдется некоторая оценка сверху < Ь. Зафиксируем число к с условием 0 <к<а/Ь и покажем, что Н = (—к, к) — искомый интервал для функции сдвига пучка [Р, Q; Н].
При любом взятом из Н, на окружности как границе круга К обнаруживаются неравенства <к^| <кЬ<а< |Р |. Следовательно, в силу теоремы Руше [8] в круге К столько же корней многочлена Р + ^ с учетом их кратностей, сколько у многочлена Р. Ясно, что число таких корней равно степени п многочлена Р, поскольку окружность, ограничивающая круг К, охватывает все его корни. Вне круга К число корней многочлена Р + ^ с учетом их кратностей естественно не превосходит к — п (если к = п или £ = 0, то вне круга К их попросту нет).
Если выбрать некое мнимое число т (Де(т) = 0) из круга К, то так же, как на границе круга, обнаружатся аналогичные неравенства
|^(т)| < ЛЬ < а < |Р(т)|.
Следовательно, как на границе круга К, так и на границе его правой половины, образованной пересечением круга К с правой полуплоскостью, соблюдается условие < |Р|.
Теперь, после вторичного применения теоремы Руше к тем же многочленам Р и выясняется, что число корней многочлена Р + ^ в правой половине круга К с учетом их кратностей равно сдвигу многочлена Р, т.е. числу р(0). Следовательно, учитывая произвольность выбора £ в интервале Н, можно утверждать, что значение р(0) есть минимум функции сдвига р.
С другой стороны, имеет место оценка сверху р(£) — р(0) < к — п. Если учесть все корни вместе с их кратностями у многочлена Ркоторые расположены справа от мнимой оси и при этом оказались вне круга К, то число всех таких корней равно разности р(£) — р(0). Однако, как уже было отмечено, число всех корней многочлена Р + ^ вне круга К не превосходит к — п.
Лемма 3 доказана.
Следствие. Пусть в условиях леммы 3 соотношение между степенями заменено на другое: к < п. Тогда существует интервал С = (—д,д), при котором пучок [Р, Q; С] является постоянным.
Доказательство. Если к = п, то постоянство функции сдвигар пучка [Р,Q; С], когда С = Н, непосредственно вытекает из леммы 3. Если же к < п, то для поиска интервала С = (—д,д) достаточно воспользоваться преобразованием (Р+^)/(1 — г) = Р+г(Р+Q)/(1 —г). Лемма 3 применительно к многочленам Р и Р + Q (здесь к = п) позволяет обнаружить постоянный пучок [Р, Q + Р; Н], где Н = (—Л, Л,), и заодно интервал С = Н/(1 + Л). В этом случае, если некое число г находится в интервале С, то число г/(1 — г) попадает в Н. Поэтому имеем р(г) = р(0), так как сдвиги многочленов Р + ^ и (Р + /(1 — г) равны, а второй из них — (Р + /(1 — г) = Р + г(Р + Q)/(1 — г) — содержится в постоянном пучке [Р, Q + Р; Н] вместе с многочленом Р.
Следовательно, пучок [Р, Q; С] тоже постоянен, что и требовалось установить.
Способ доказательства леммы 3 позволяет сформулировать еще один важный результат, который предлагается в виде очередной леммы.
Лемма 4. Пусть даны регулярный многочлен Р, некий многочлен Q и полуинтервал С = [0,д) такие, что каждое значение р(г) функции сдвига р пучка [Р, Q; С] при г > 0 удовлетворяет строгому неравенству р(0) < р(г). Тогда для любого д > 0 в данном пучке найдется некий многочлен Р + ^ с таким корнем х, который обладает свойствами Ке(х) > 0, |х| > д.
Доказательство этой леммы обнаруживается, как уже отмечено, в доказательстве леммы 3, где круг К можно выбирать сколь угодно большим. После построения соответствующего круга с радиусом больше д найдется £ (0 < £ < Л, £ < д; Л — число из леммы 3), при котором в силу неравенства р(£) — р(0) > 0 многочлен Р + ^ данного пучка будет иметь справа от мнимой оси, по крайней мере, один корень, расположенный вне круга К.
Теорема 7. Любой регулярный и правильный пучок [Р, Q; О] является постоянным.
Доказательство. Зафиксируем некоторое число д в О и предположим, что оно не единственное в нем и Q — ненулевой многочлен (иначе говоря, данный пучок будет состоящим лишь из одного многочлена и, очевидно, постоянным). Покажем, что функция сдвига р пучка [Р, Q; О] постоянна в некоторой окрестности числа д.
Рассмотрим пару многочленов М = Р + qQ, Q и убедимся в том, что к ним применимо следствие из леммы 3. По условию теоремы 7 первый из них М — регулярный (как и любой в пучке [Р, Q; О]). С другой стороны, степень второго Q не превосходит степени многочлена М, так как в данном правильном пучке [Р, Q; О] существует еще один, который имеет вид М + где £ = г — д = 0,и обладает той же степенью многочлена М. Поэтому можно применить упомянутое здесь следствие и обнаружить постоянный пучок [М, Q; С] с интервалом С = (—д,д). Теперь ясно, что сдвиги р(г) = з(Р + многочленов Р + ^ = М + где г = д + которые содержатся в постоянном пучке [М,Q; С], не меняются с изменением числа £ в С, т. е. р(г) = р(д), если д — д<г = д + £ < д + д.
Таким образом, функция р дифференцируема в точке д с нулевой производной в ней, и для завершения доказательства достаточно учесть, что выбор числа д из промежутка О был произвольным. В итоге имеем функцию р, дифференцируемую во всей области определения — на промежутке О — и всюду с нулевой производной. Хорошо известно, что такая функция постоянна (глобально) на всем промежутке О.
Теорема 7 доказана.
В конкретных случаях вопрос о регулярности пучка может оказаться весьма сложным. Однако для пучка, к примеру, [Р, х{Р}; К], где Р — некий фиксированный многочлен вида
(1), этот вопрос сводится к вопросу о регулярности какого-либо одного многочлена вида
Р + гх{Р} = (а0 + га1)хп + а1хп-1 + ...
при некотором г. В вещественном случае теорема 4, по сути дела, дает некий критерий регулярности пучка [Р, х{Р}; О]. Чтобы сформулировать подобный критерий, охватив при этом комплексные многочлены, убедимся в том, что равенство (7) и лемму 1 можно обобщить.
Лемма 5 (обобщение леммы 1). Пусть Р(т) = 0, где Р — произвольный комплексный многочлен, а число т — мнимое (Де(т) = 0). Тогда Р~(т) = {Р}(т) = 0.
Доказательство, как и для леммы 1, так же непосредственно получается из соответствующих определений сопряженного отражения Р~ и срезки по формуле (4~):
Р ~(т) = (Р -)Л (т) = Р -(—т) = Р-(т) = Р (т) = 0,
2{Р }(т) = Р (т) — (—1)гаР~(т) = 0.
Лемма 5 доказана.
Равенство (7) для комплексного случая получается из очевидных свойств сопряженного отражения
(Р + Q)~ = Р~ + Q~, (гР)~ = гР~, (хР)~ = —хР (Р = Р, а также аналогичных свойств сопряженной срезки
{Р + Q} = {Р} + {Q}, {гР} = г{Р},
2({Р} + (—1)п {Р}~) = Р — (—1)гаР~ + (—1)П[Р — (—1)гаР~]~ = = Р — (—1)гаР~ + ((—1)пр — Р~)~ = 0,
2{х{Р}} = х{Р} — (—1)п(х{Р})~ = х{Р} — (—1)п(—х){Р=
= х[{Р} + (—1)П{Р }~] = 0
(г — вещественное число). В итоге вновь получаем то же самое равенство (7) {Р+гх{Р}} = {Р}.
Теперь можно предложить критерий регулярности пучка (как бы обобщение теоремы 4).
Лемма 6. Если при заданном Р хотя бы один многочлен вида Р + гх{Р} регулярен, то пучок [Р, х{Р}; О] на любом промежутке О (в частности, О = Л) является регулярным.
Доказательство. Как и в доказательстве теоремы 4, здесь достаточно использовать лемму 5 как аналог леммы 1 и обобщенное равенство (7). Предположив существование в данном пучке какого-нибудь критического многочлена Q = Р + £х{Р}, £ € О с некоторым мнимым корнем т, обнаружим противоречивый итог: ^}(т) = {Р}(т) = Р(т) = 0 (все многочлены вида Р + гх{Р} имеют корень на мнимой оси).
Лемма 6 доказана.
Что касается постоянства пучка [Р, х{Р}; О], из теоремы 7 и леммы 6 непосредственно получается
Следствие (критерий постоянства). Правильный пучок [Р, х{Р}; О] постоянен, если многочлен вида Р + гх{Р} регулярен при некотором вещественном г.
Далее предлагается результат как существенное дополнение к теореме 7 на случай неправильных пучков.
Лемма 7. Пусть даны квазинормализованные многочлены Р степени п—1 и Q = хп+... (нормализованный) и некий полуинтервал С = [0,д), 0 < д < то, которые образуют регулярный пучок [Р, Q; С]. Тогда такой пучок постоянен.
Доказательство. В силу квазинормализованности Р по определению 1 при х —> то имеем
Ке(Р (х)/хп-1) —► 1.
В частности, вне некоторого круга К с центром в нуле соблюдается неравенство Ке(Р(х)/хп-1) > 1/2. С другой стороны, функция ^(х) — хп)/хп-1 вне того же круга К ограничена по модулю сверху некоторым числом Ь > 0. Поэтому существует такое Л с условиями 0 < Л < 1/(2Ь) и Л < д, что соотношение
Ке[(Р(х) + г^(х) — хп))/хп-1] > 0 (11)
соблюдается при любых г и х, расположенных в интервале (0, Л) и вне круга К.
Без многочлена Р, когда случай г = 0 исключается, данный регулярный, но неправильный пучок [Р, Q; С] превращается в регулярный и правильный [Р, Q; (0,д)]. Поэтому согласно теореме 4 функция сдвига р пучка [Р, Q; С] на интервале (0, д) постоянна и, следовательно, имеет не более двух значений на полуинтервале С : р(0) и некое с = р(г) для г > 0. При этом имеет место соотношение р(0) < с, так как в силу леммы 3 сдвиг р(0) регулярного многочлена Р есть локальный минимум функции р.
Теперь предположим, что функция р не постоянна: р(0) < с. Тогда р(0) < р(г) = с для всех г в пересечении интервалов (0,д) и (0,Л). В силу леммы 4 существует такое число £ в полуинтервале [0,Л), при котором многочлен Р + ^ вне круга К имеет корень г, обладающий свойством Ке(г) > 0.
Получилось противоречие: с одной стороны, имеют место равенства
0 = (Р (г) + ^(г))/гп-1 = + (Р (г) + ^(г) — гп ))/гп-1, а, с другой — в силу соотношений (11), Ке(г) > 0 и £ > 0 обнаруживается
Ке[£г + (Р(г) + ^(г) — гп))/гп-1] > 0.
Полученное противоречие убеждает в том, что р(г) = р(0) для всех г в полуинтервале С.
Лемма 7 доказана.
Итак, все готово к тому, чтобы доказать теорему 6 и заодно регулярный случай теоремы 5, так как он, по сути дела, приводит к теореме 6 с вещественным многочленом Р.
Доказательство теоремы 6 (и регулярного случая теоремы 5).
Введем обозначение Q = Р — дх{Р} и учтем два замечания: первое — 4, в, второе — 7, а. Согласно этим замечаниям достаточно ограничиться случаем deg(P) = п, при котором deg{P} = п — 1. Тогда, поскольку = {Р} по формуле (7), имеем п — 1 = deg{Q} < deg(Q) < deg(P) = п, т. е. deg(Q) = п — 1.
Пусть с — старший коэффициент многочлена Q. Тогда имеем = Ке(с)хп-1 + • • • = {Р} = Ь1хп-1 + .... Следовательно, Ке(с) = Ь1 = Ке(а1). В таком случае многочлены М = Q/b1, х{М} = х{Р}/Ь1 с полуинтервалом К+ удовлетворяют всем условиям леммы 7: многочлен М — квазинормализованный, так как Ке(с/Ь1) = 1, х{М} — нормализованный,
и, наконец, [М, х{М}; Л+] — регулярный в силу леммы 6 (Р — регулярный, следовательно, и М тоже). Поэтому пучок [М, х{М}; Л+] постоянен, в нем содержатся многочлены М и М + qx{M} ^ > 0).
В итоге з(М) = з(М + qx{M}), и, поскольку Ь1(М + qx{M}) = Q + qx{P}, имеем
= ^ + qx{P }) = з(Р). Теорема 6 доказана.
Осталось рассмотреть теорему 5 с особенным вещественным многочленом Р. Доказательство (теоремы 5 в критическом случае). В силу леммы 2 имеем Р = хкMQ и {Р} = хкМ{га+кQ}, где Q — регулярный. Отсюда следует Р — qx{P} = хкМ(Q — qx{ra+k Q}).
Пусть deg(Q) = 3. Тогда имеем п = deg(P) = deg(xkМ) + deg(Q) = deg(xkМ) + 3. Поскольку deg(P — qx{P}) < п, получается
deg(P — qx{P}) = deg(xkМ) + deg(Q — qx{ra+kQ}) < п = deg(xkМ) + 3.
Следовательно, deg(Q — qx{ra+kQ}) < 3. Согласно замечанию 4, а после определения 6 имеем {п+кQ} = Q}, так как п + к — 3 = 2к + deg(M) — четное целое число (впрочем, другой случай {п+кQ} = немедленно привел бы к противоречию: deg(Q — qx{ra+kQ}) =
3 + 1).
Таким образом, имеем вещественный регулярный многочлен Q степени 3 > 0. Полагая п = 3 и применяя теорему 6, получим — qx{jQ}) = з^). Отсюда вытекает
з(Р) = з(хк MQ) = з(хк М ^ — qx{j Q})) = з(хк М (Q — qx{ra+k Q})) = з(Р — qx{P}).
Что и требовалось доказать.
Замечание 9. Лемма 2 (об общем делителе) позволяет установить постоянство любого правильного вещественного пучка [Р, х{Р}; О], а в некоторых случаях с учетом замечания 7, б и комплексного тоже, когда допускается нерегулярность.
3. Несколько вспомогательных утвеpждений и пpименение их к некотоpым пpимеpам
На следующем примере покажем применение леммы 7 в том случае, когда никакие "альтернативы" попросту не пригодны и алгоритм Рауса в связи с этим приводит к некоторым "нестандартным" осложнениям: к случаю, когда а1 = 0 у многочлена Р вида (1) и степени п или ап-1 = 0 в случае "транспонирования" многочлена Р (см. ниже определение 10).
Пример 1. Рассмотрим многочлен М = х8 + 1 и воспользуемся пучком [Р, Q; Л+], где Р = х7 + 1 и Q = х8 — х7. Очевидно, что этот пучок является регулярным. Многочлен М = Р + Q находится в пучке [Р, Q; Л+], который постоянен в силу леммы 7. Поэтому з(М) = з(Р + Q) = з(Р). Дальнейшее понижение степени целесообразно производить по-другому, используя лемму 6 и "транспонирование" многочлена (см. ниже пример 2).
Определение 10. Многочлен Р* называется транспонированным к Р степени к, если при всех х = 0 имеем
Р *(х) = хк Р (1/х). (12)
Если же, в свою очередь, Р** = (Р*)* = Р, то Р* и Р называются взаимными [9, с. 306].
Ясно, что при любом Р = 0 существует и единственный Р*, deg(P*) < deg(P). Более того, очевидна следующая
Лемма 8 (о взаимности). Каждое из двух соотношений Р(0) = 0 или deg(P*) = deg(P) влечет за собой взаимность многочленов Р*,Р. Имеет место и обратное: из их взаимности вытекают соотношения Р(0) = 0, deg(P*) = deg(P).
К примеру, когда Р(0) = 0, то нет взаимности у пары (Р*, Р), так как в силу формулы (12) обнаруживается Р*(х)/хк = Р(1/х) —> 0 при х —> то. Следовательно, deg(P*) < к = deg(P). (Однако при любом Р = 0 имеем Р*(0) = 0, т. е. Р**, Р* взаимны всегда.)
Лемма 9. При любом Р = 0 имеет место равенство з(Р*) = з(Р).
Доказательство. Чтобы сравнить сдвиги многочленов, достаточно убедиться с помощью формулы (12) в том, что число г является корнем одного из многочленов Р или Р* с условием Ке(г) > 0 тогда и только тогда, когда у = 1/г с тем же свойством Ке(у) > 0 есть корень другого из этих многочленов. Формула (12) убеждает также и в том, что кратности этих корней одинаковы. Таким образом, можно попарно пересмотреть все корни данных многочленов, расположенные справа от мнимой оси, и обнаружить совпадение сдвигов у этих многочленов.
Лемма 9 доказана.
Касаясь регулярности многочленов из леммы 9, нетрудно заметить, что если один из них имел бы мнимый корень т = 0, то в силу формулы (12) у другого тоже был бы мнимый корень 1/т. Поэтому можно сказать, что доказана
Лемма 10. Многочлен Р регулярен в том и только в том случае, когда Р* таков же, и Р(0) = 0. (Взаимные Р, Р* регулярны одновременно.)
Целесообразно отметить (без доказательства) еще два достаточно простых утверждения:
Лемма 11. Если один из многочленов Р и Рл регулярен, то и другой таков же.
Лемма 12. Равенство з(Р) + з(Рл) = deg(P) справедливо в том и только в том случае, когда многочлены Р, Рл регулярны.
Пример 2 (продолжение к примеру 1). Пусть Р = х7 + 1 и п = 7, тогда {Р} = 1. В силу леммы 6 правильный пучок [Р, х{Р}; К] регулярен, поскольку Р регулярен. В свою очередь, теорема 7 утверждает, что такой пучок постоянен и, в частности, з(Р) = з(Р + х). Согласно лемме 9 имеем з^*) = з^), где Q = Р + х, Q* = х7 + х6 + 1. Наконец, в силу теоремы 5 приходим к очередному (см. пример 1) понижению степени: з^*) = з^* — х^*}) = з(х6 — х + 1) = з(Р). (Для следующего понижения целесообразно воспользоваться леммой 11.)
Чтобы можно было эффективно пользоваться предыдущими леммами в связи с транспонированием многочленов, желательно иметь еще одно альтернативное утверждение (теорема 8) относительно сдвига многочлена Q, в котором при понижении степени учитывался бы его транспонированный вид
Q = а0 + а1х + а2х2 + ..., (13)
где а0 = 0 или Q = Р* , где Р вида (1) и степени п.
Предположим, что свободный коэффициент а0 многочлена Q (старший для Р) является вещественным. Тогда найдется некий многочлен удовлетворяющий равенству х{^} = ^ — Q~)/2 = Его можно представить в транспонированном виде = Ке(а1) + (а2 — а2)х/2+... , что естественно получается по формуле = {Р}*, если deg{P} = п — 1. В связи с этим (и с тем, что степень многочлена Q в виде (13) непосредственно не учитывается) многочлен {'Q} будем называть транспонированной срезкой.
Теорема 8 (транспонированный аналог теоремы 6). Пусть даны многочлен Q степени
п с вещественным значением Q(0) = 0, число q > 0 и равенство
Q — q{/Q} = хМ, (14)
где М — некий многочлен. Тогда многочлен Q регулярен в том и только в том случае, когда регулярен многочлен М, и при этом
= ^ — q{/Q}) = з(М). (15)
Более того, равенства (15) справедливы и в том случае, когда Q — особенный вещественный многочлен.
Доказательство. Ясно, что п > 1. Покажем, что М = (Р — qx{P})* , где Р = Q*. В силу леммы 8 о взаимности имеем Q = Р* и deg(Q) = deg(P) = п. Сопряженные многочлены Q-,P- тоже взаимны: к примеру, при любом вещественном у = 0 имеем Q-(y) = Q(y) = упР(1/у) = упР-(1/у), т.е. Q- = (Р-)* . Поэтому при любом г = 0 имеют место равенства Q~(z) = (Q-)Л(г) = Q-(—г) = (—г)пР-(—1/г) = (—г)гаР~(1/г). Теперь, учитывая последнее, формулу для транспонированной срезки = (Q — Q~)/(2х) и
равенство (14), имеем
Q(x) — q{/Q}(x) = Q(x) — q(Q(x) — Q~ (х))/(2х) =
= хпР (1/х) — q[xra-1P (1/х) — (—х)п-1 Р~(1/х)]/2 =
= хп(Р (1/х) — ^/х){Р }(1/х)) = хМ (х). (16)
Из последнего равенства (16) выясняется, что при х —> 0
хп(Р(1/х) — ^/х){Р}(1/х)) —► 0.
Следовательно, deg(P — qx{P}) < п = deg(P). Отсюда, как в доказательстве теоремы 6, получается deg(P — qx{P}) = п — 1.
Таким образом, от равенства (16) приходим согласно определению 10 к искомому
М (х) = хп-1(Р (1/х) — ^/х){Р }(1/х)) = (Р — qx{P })*.
При этом многочлен Р — qx{P} в нуле принимает значение Р(0) = Q*(0) = 0. Поэтому в силу леммы 8 многочлены М, Р — qx{P} взаимны.
Теперь, учитывая лемму 9, теорему 5 и равенство (14), в вещественном случае получаем
= = з(Р) = з(Р — qx{P}) = з(М) = — q{/Q}), (17)
что и влечет требуемые равенства (15).
В комплексном случае, когда дана регулярность одного из многочленов Q или М, в силу лемм 9, 10 и 6, теоремы 6 и (14) имеет место регулярность и другого многочлена из этой же пары и заодно получается та же цепь равенств (17). Теорема 8 доказана.
В примере 1 рассматривался многочлен, к которому с помощью различных срезок никакие полученные результаты непосредственно не применимы. В связи с этим интересен следующий
Пример 3. Пусть Р = х8 + х3 + 1. Если п = 9, то имеем {Р} = х8 + 1. В силу лемм 6 и 7 пучок [Р, х{Р}; Л+] регулярен и постоянен, если регулярен многочлен Q = Р + х{Р}.
(Вначале степень повышается!) К многочлену Q можно применить теорему 8: Q — = х(х8 + х2 — х + 1) = хМ. Если М регулярен, то Q таков же и з^) = з(М).
Далее Мл — {'Мл} = х(х7 + х + 1) = хМ1, и выясняется, что вопрос о регулярности многочлена Р и его сдвиге з(Р) свелся к такому же вопросу относительно многочлена М1 степени 7. Если последний регулярен (регулярность многочлена М1 можно проверить и непосредственно), то в силу теоремы 8 многочлен Мл тоже регулярен и з(Мл) = з(М1). С другой стороны, в силу лемм 11 и 12 з(Мл) = 8 — з(М). И остается учесть з(М) = = з(Р). Последнее равенство имеет место, так как многочлены Q,P содержатся в постоянном пучке [Р, х{Р}; Д+].
Аналогичным способом можно продолжить понижение степени.
Следующий пример как некое обобщение примера 3 показывает, каким образом можно избежать тех погрешностей округления при арифметических действиях над числами, которые в алгоритме Рауса не позволяют достичь достоверного результата [3].
Пример 4. Пусть Ь = Р + гМ, где Р — из примера 3, М = х7, а число г настолько близко к нулю, что формула (2) практически становится бесполезной: здесь п = 8, д = 1/г и многочлен Ь — х{Ь}/г = гх7 — х4/г + х3 + 1. Если пренебрегать числом г2 (округлять его, заменять нулем), то задача сведется, по существу, к исследованию многочлена х4 — гх3 — г, что приведет к большой ошибке. Правильные и регулярные пучки [Р, М; Л], [х8 + 1, х3; Д] постоянны, и поэтому з(Ь) = з(х8 + 1) = 4 при любом г. Однако, применяя теорему 5 при г < 0, имеем з(х4 — гх3 — г) = з(х3 + 1) = 2.
Пример 3 показывает, что предварительное повышение степени позволяет избежать таких "аварийных" ситуаций. Пусть п = 9 и Q = Ь + х{Ь}. Далее можно действовать по той же схеме понижения степени, как в примере 3, и получить многочлен х7 + гх5 + гх4 — гх3 + х + 1. Он настолько "приличный", что можно было бы пренебречь числом г (занулить малые коэффициенты и продолжить понижение степени по предыдущей схеме аналогично).
Список литературы
[1] Гантмахер Ф. Р. Теория матриц. М.: Наука, 1967.
[2] Постников М. М. Устойчивые многочлены. М.: Наука, 1981.
[3] Антончик В. С. О проверке гурвицевости многочлена // Автоматика и телемеханика. 1995. №6. С. 56-62.
[4] Корн Г., Корн Т. Справочник по математике. Для научных работников и инженеров. М.: Наука, 1973.
[5] Харитонов В. Л., ХинричсЕн Д. О выпуклых направлениях для устойчивых полиномов // Автоматика и телемеханика. 1997. №3. С. 81-92.
[6] ВоЕводин В. В. Вычислительные основы линейной алгебры. М.: Наука, 1977.
[7] Хорн Р., Джонсон Ч. Матричный анализ. М.: Мир, 1989.
[8] Привалов И. И. Введение в теорию функций комплексного переменного. М.: Наука, 1967.
[9] Кострикин А. И. Введение в алгебру. Основы алгебры. М.: Наука, 1994.
Поступила в редакцию 25 февраля 2000 г.