УДК 517.977
Вестник СПбГУ. Сер. 10, 2006, вып. 2
С. В. Погожее НИЖНЯЯ ОЦЕНКА
ДЛЯ СРЕДНЕКВАДРАТИЧНОГО ФУНКЦИОНАЛА В М1МО-ЗАДАЧЕ
Теория синтеза оптимальных регуляторов, обеспечивающих минимум среднеквадратичных функционалов для линейных объектов, подверженных воздействию внешних возмущений случайного характера, пользуется заслуженной популярностью. Необходимо отметить, что, как и все подходы, находящиеся в рамках линейно-квадратичной гауссовской проблемы, среднеквадратичная оптимизация является сравнительно грубым математическим аппаратом анализа и синтеза динамических систем. Однако этот подход исключительно широко распространен в силу своей достаточной адекватности (как комплекса математических моделей) объективной реальности, что подтверждается богатым опытом его практического применения. Даже в самых сложных случаях среднеквадратичная оптимизация дает определенную информацию о свойствах объекта, которая может быть полезной при использовании более тонких и глубоких методов теории управления.
В современной трактовке изучаемый круг вопросов относится к теории оптимизации линейных систем по нормам пространств Н2 и Нос [1-3]. В частности, аналогичные задачи можно рассматривать с позиций ЬС^-оптимального синтеза [4]. Однако подобный подход, широко используемый в настоящее время для решения практических задач, требует существенной адаптации применительно к среднеквадратичному подходу, что значительно снижает вычислительную эффективность синтеза.
В настоящей статье проводится построение оценки снизу для оптимального (минимального) значения среднеквадратичного функционала без непосредственного решения задачи синтеза оптимального управления. Впервые данная задача для БКО-систем была поставлена в [5] и получила свое развитие в [6], где был рассмотрен случай Б1МО-систем со скалярными управлением и возмущением. Здесь исследована наиболее общая ситуация для систем с многомерным управлением и возмущениями неполного ранга.
Введем в рассмотрение математическую модель объекта управления, представленную в виде системы обыкновенных дифференциальных уравнений
Здесь х е Еп - вектор состояния объекта, И € Ет - вектор управлений, Г € Е" - возмущение (у ^ п), Ё - векторная функция соответствующей размерности, компоненты которой непрерывны и дифференцируемы по совокупности своих аргументов в окрестности некоторого заданного контролируемого движения х = хр(£), й = йр(£), Г = Гр(£), удовлетворяющего систему (1) хр = Ё(£,хр,йр,?р).
С учетом свойств функции Ё система (1) может быть линеаризована в окрестности контролируемого движения, что приводит к системе линейных дифференциальных уравнений объекта управления вида
х = Е (£, х, и, Г) .
(1)
х = Ах + Ви + Ш(*).
(2)
© С. В. Погожев, 2006
В дальнейшем будем считать, что уравнения исходной модели (1), а также рассматриваемое контролируемое движение таковы, что матрицы А, В, Н не зависят от времени, т. е. их компоненты являются константами, и выполняются два условия:
х + хр, и + йр, Гр) — Ах — Ви|| ^ 0(||х|| + ||и||),'> гапд{В, АВ, А2В, ..., АП_1В) = п,
где в 0 при |х| -> 0, |и| -» 0.
Также будем предполагать, что вектор х недоступен непосредственному измерению, и измерительные устройства выдают информацию лишь о части компонент вектора состояния. Иными словами, непосредственному измерению подлежит вектор у € Е*, размерность которого меньше, чем размерность вектора х, т. е. к < п.
В общем случае между векторами х и у существует нелинейная связь. Однако предположим, что она допускает линеаризацию, которая приводит к системе линейных уравнений
у = Сх. (3)
Будем предполагать, что пара А, С вполне наблюдаема.
Наряду с математической моделью объекта управления введем в рассмотрение систему уравнений, представляющую динамику линейного устройства управления (регулятора непрямого действия [7]):
¿ = М2 + М1у + М2у + ... + М|1у('*),
в которой г е Ег - вектор состояния регулятора, М, М* {г — 1, /л), К - матрицы с постоянными компонентами.
С использованием понятия «вход-выходной» модели [8, 9] уравнения регулятора (4) могут быть представлены в виде
и = (р) у, (5)
где р — -¿I - оператор дифференцирования; ЛУ(р) = ЛЛ^^/И^О?) - передаточная матрица регулятора, компонентами которой являются дробно-рациональные функции от р (множество таких передаточных матриц будем обозначать Л).
При нулевых начальных условиях по вектору г, используя представление системы (4) в изображениях по Лапласу, получим
(я) = К (яЕГ - М)"1 (Мх + М26- + ... + М.„а").
Регуляторы вида (5), обеспечивающие асимптотическую устойчивость заданного движения Хр, йр, будем называть стабилизирующими. Множество передаточных матриц регуляторов таких, что характеристический полином замкнутой системы
, 7 ЛЫЕ* -СВ(в) \ „ й
ДЫ = ттг , Лч является гурвицевым, в дальнейшем обозначим
4 ' \ -пцв) ТУ2(5)Ет )
символами Здесь А (я) = с1е1(Ез - А) - характеристический полином разомкнутой системы (объекта управления), В(з) = Л(в)(Ев - А)_1В - полиномиальная матрица, Ед; и Ет - единичные матрицы размеров к х к и тп х тп.
Зададим некоторый неотрицательный функционал на движениях замкнутой системы (1), (5) при условии й = йр + и:
J = J(x(t), и(г)) = J(W).
Очевидно, что при прочих равных величина этого функционала однозначно определяется выбором передаточной матрицы стабилизирующего закона управления (5).
Определение 1. Задачей аналитического синтеза будем называть оптимизационную задачу вида
3 = J (\у) Ы weno
о поиске наилучшего по отношению к функционалу Л закона управления, стабилизирующего систему (2), (3), (5).
В дальнейшем основное внимание в работе будет уделено функционалам, характеризующим динамику замкнутой системы, находящейся под воздействием возмущений случайного характера. .
Для конкретизации класса допустимых возмущений рассмотрим совокупность непрерывно дифференцируемых функций времени <£>(£), удовлетворяющих трем требованиям:
т т
Ига ~ [ ¥>(«) ей - 0, Ига ~ [ <Й = > 0,
Т—>оо 1 J 2 —>оо 1 J
0 О
соэшт с1т — Б^ш),
где - наперед заданное четное дробно-рациональное выражение.
В дальнейшем в качестве возмущения Г будем рассматривать векторную функцию времени, компоненты которой принадлежат указанному классу. В частности, в качестве такого возмущения можно принять случайный векторный стационарный процесс, имеющий непрерывно дифференцируемые реализации, обладающий эргодичес-ким свойством, имеющий нулевое математическое ожидание и характеризуемый заданной матрицей Б/(со) спектральных плотностей.
Тогда по отношению к исходной модели объекта (1) можно говорить о том, что воздействие i(t) определяет некоторые стационарные отклонения случайного характера относительно расчетного возмущения которые не затухают со временем. Интенсивность (мощность) этих отклонений определяется величинами дисперсий Бц. Будем считать, что заданная матрица спектральных плотностей допускает факториза-
цию, т. е. может быть представлена следующим образом:
8/ И - ГЧ, (и) /7) Н = Бг (.И в! (-зш),
где (¿ш) = N (^'ш) /Г(^и;), Т - гурвицев полином; N - полиномиальная матрица (у х у) с гурвицевыми компонентами.
Для линейного объекта (2), (3), замкнутого любым стабилизирующим регулятором вида (5), указанное возмущение вызовет соответствующее движение х(£), и(£), причем компоненты векторов х и и - это функции того же класса, что и компоненты векторного возмущения í(t).
ОО 1
I ^ ^ I ¥>(< + т)ф) <й
В рассматриваемых условиях естественно ввести понятия точности стабилизации и энергетических затрат на стабилизирующее управление, связав их с величинами дисперсий компонент вектора х состояния и вектора и управления с помощью равенств Jx — — -Ой - Здесь ж(£), й(£) - обобщенные выходные координаты объекта,
удовлетворяющие условиям
ж2(г) = х'^ььф), й2(0 =
где И - симметрическая неотрицательно определенная матрица (п х п); С^ симметрическая положительно определенная матрица (т х т). Компоненты матриц Л и отражают «веса» отклонений по компонентам векторов х и и в величинах точности и энергетических затрат в процессе стабилизации.
Введенные характеристики могут быть вычислены по формулам
i оо
Зх =< х2 >=< х'Их >= Нт ^ [ х'(г)Кх(г)<Й = [ 5
Т-> оо 1 ) ]
оо
(и>)с1и1,
Зи =< гг >
о о
Т оо
2 1
=<и'<3и>= Нт ~ [ и\г)(}и(г)<и= [ 8й(и)<Ь,
Т->оо Л ,/ J
о о
в которых , 5й - спектральные плотности функций ¿(¿) и й(£). Поскольку эти функции есть результат прохождения сигнала {(Ь) через устойчивую линейную замкнутую систему, имеют место соотношения
где и - передаточные матрицы замкнутой системы от £(£) к х и и.
Из уравнений (2), (3), (5), представленных в изображениях по Лапласу, следует, что при нулевых начальных условиях выполняются равенства Х(в) = Ги (в) — Г/и(в)Г(в), = [Ее — А — В¥(5)С]_1Н, Ffu = \У(я)С[Е5 — А — В\¥(я)С]_1Н. При этом имеем
Зх = 3Х{Л>V) =< х'Их >=
оо
= I Бр {н'ОыЕ - А - В\У О'ш) С]_1'к[гыЕ - А - ВЛУ О'ш) С]"1 Ш/Н} с^,
Л =< и'С^и > =
оо
- I Бр {н'^ыЕ - А - ВУГСГ^С'У/'ОЮС [¿шЕ - А - Нв/Н} <Ь).
о
Введем в рассмотрение обобщенную характеристику качества процесса стабилизации, однозначно определяемую выбором передаточной матрицы
J = J(W) = Jx{W) + c" JU(W) =< x'Rx > +cl < u'Qu >, (6)
здесь c0 = const - весовой множитель, определяющий соотношение между точностью и мощностью управления.
Заметим, что, согласно проведенным рассуждениям, функционал (6) может быть представлен так:
оо
J=J(W) = I Sp {Г [W (p), w] S/MJdw,
где Г = H'tfwE - A - BW(jw)C]_1 R [jwE - A - BW(jw)C]_1 H + cgH'[jo;E - A-BW(jw)C]-1'C'W'0'a;)QW0-w)C [jwE - A - BW(ju;)C]-1 H.
Определение 2. Задачей среднеквадратичного синтеза для системы (2), (3), (5) будем называть задачу оптимизации вида
где J определяется формулой (6).
Рассмотрим вопрос о построении оценки снизу для оптимального значения среднеквадратичного функционала в задаче (7) при условиях (2), (3), (5), (6).
В качестве нижней оценки примем положительное число Jam, вычисляемое по формуле
Jam=rninJ(W), (8)
в которой Q - указанное выше множество матриц размера т х к с дробно-рациональными компонентами. Иными словами, величина Jam характеризует минимальное значение среднеквадратичного функционала, поиск которого не отягощен требованием устойчивости замкнутой системы. Отметим, что, поскольку fio С fí, выполняются очевидные соотношения
Jam = min J(W) ^ min J(W) = J0,
wen weiio
т. е. введенное формулой (8) число Jam действительно является нижней оценкой для оптимального значения Jo функционала в задаче (7).
В дальнейшем величину Jam будем называть абсолютным минимумом среднеквадратичного критерия качества. Получим формулы для ее аналитического поиска, что требует проведения ряда вспомогательных рассуждений.
Пусть известна некоторая детерминированная векторная функция f(i), которая задана на интервале t £ [0, оо). Будем считать, что на этом интервале все ее компоненты являются непрерывными функциями времени.
Будем также считать, что для функции f(i) существует изображение по Лапласу f (s) и выполняется условие
т
lim ± [ f'(t)f(t)dt = f0 ф 0.
Т—>оо 1 J 0
Заметим, что среднеквадратичный функционал (6) зависит от движений системы (2):
J = J(x(i), и(£)) =< x'(t)Rx(t) > +cl < u'(i)Qu(i) > . (9)
Поставим задачу о поиске минимума функционала (9) на множестве fi4 пар {x(i),u(i)} векторных функций времени:
J(x(i),u(i)).-> inf
{x(t),u(i)}ei2'
Теорема 1. Функции x(f), u(i), удовлетворяющие дифференциальным уравнениям
g(-p)g(p)u = L(p)/(i),
при определенным образом выбранных начальных условиях обеспечивают минимум функционала (6). Здесь
Ш = -9{-РШ (G(-p)G(p))-1B'(-p)RH(p), М(р) = Шд(-р)Щр) + B(p)L(p)) /Л(р), А(р) = det (Ер - А), В(р) = Л(р)(Ер - А)_1В, Н(р) = Л(р) (Ер - А)-1 Н, G(-p)G(p) = CqA(~p)QA(p) + В'(—p)RB(p), Ер - А О -В
R (-Ер - А)' О О -В' CqQ
з(-р)з(р) = det
Доказательство. Составим уравнения Эйлера-Пуассона для функционала (6) с учетом связи (2) (при £ = Г):
0F дх
1 Л (др\ п (■ Т~\ дР ¿(др\ пС Т—\ лт
где Р — х'Вх+Сои^и-Ь ]Г) (¿л — А^х — В^и — Н^Г^; к/. - множители Лагранжа,
к=1 ^ ' А/., В& и н^ - &-е строки матриц А, В и н соответственно. После несложных преобразований с учетом (2) получим систему в изображениях по Лапласу при нулевых начальных условиях
2Кх + (—Ее — А)'Ь' — О, 2с§С$и - ВЪ' = О, (Ей - А)х - Ви = Ш,
где (/11 (г), Л2(<), - М*))-
Далее, исключая из первого и второго уравнений вектор Ь, находим
л(-в)с§ри + в'(-в)Вх = о, Л(я)х-В(в)и = Н(в)?, откуда следуют соотношения
С(-в)С(в)и = -В'(-в)КН(в)?(в), . .
А(з)х= [Н(б)-В(5)(С(-5)С(5))-1В'(-5)НН(5)]ф). 1 '
Дважды используя формулу [10]
= |А||Б-СА"1В|> (|А| ф 0),
вычислим следующий определитель вспомогательной блочной матрицы:
А В С Б
= А, (1е1
Р 0 -В "
ИР* 0 =Аас
0 -В' с^ ]
Р* ИР 'в
Г Р*. 0 и
1 -в' с1а 0
Р-1 [ о -В ] =
-В' с2д
= А3А; ае^с^ + В'Р^НР^В)
(13)
- АаА\ {с20А*8ЦА5 + В;1Ш,)) = [А:А\г-г ¿«Л (С* С).
Здесь и далее * обозначает транспонирование с заменой в на —я, В8 = В(з), А,, = А(я), Р = Ез — А.
Учитывая (13), из сопоставления формул (10) и (12) можно заключить, что любое решение уравнения (10) является экстремалью, т. е. удовлетворяет системе (11).
Заметим, что полином д(—я)д(з) степени 2п имеет корни, расположенные симметрично относительно мнимой оси. Из-за экспоненциально возрастающих слагаемых в х(£) и и(£) в общем случае критерий (6) неограниченно возрастает. Однако, если выбор начальных условий для (10) обеспечивает обращение в нуль указанных компонент, минимум критерия на экстремалях будет достигнут. Теорема доказана.
Теперь рассмотрим замкнутую систему (2), (3), (5), для которой запишем функционал (6) в частотной области:
joо
Зх = \-. I ЬрЦр^^КЕгМ + ф'^^ОРМ^МЦв, (14)
— ] оо
где Га-(в) и Г„(в) - передаточные матрицы от возмущения Г к вектору состояния х и вектору управления и соответственно. Заметим, что матрицы Ех(в) и Е„(я) не являются независимыми, а связаны соотношениями (вЕ — А) Еж — ВЕи — Н.
Лемма. Передаточные матрицы Ех(з) и Еи(в), удовлетворяющие соотношениям
Еи = ¥и0 = -(С(-5)С(я))-1В'(-я)КН(5),
¥х = ¥х0 = Л71 (Е - В(5)(С(-5)С(я))-1В'(-я)Я) Н(в),
(15)
обращают в нуль первую вариацию функционала 3\ (14) на множестве Г}.
Доказательство. Введем в рассмотрение параметр (матрицу) Ф(в) соотношением
Ф(я) =а(8)¥я(8) + р(8)¥и(8),
в котором а(я) (т х п) и /3(з) (тп х ш) - некоторые полиномиальные матрицы. Данная параметризация, впервые предложенная в [11], является удобным приемом для решения широкого класса задач по оптимизации динамических систем. Получим выражения передаточных матриц Гх. и Е„ через параметр Ф:
(sE - A) Fs - BFU = H, «Fa; + f3Fu — Ф,
FX \ _ ( H \ „ ( sE- A -B
откуда ^ p J = Z 1 ^ ^ J, где Z = ^ ^ /5 '' ИЛИ' пРименяя Ф°РМУЛУ Фробениуса для обращения блочной матрицы,
z-i = ( Р"1 -Р^В^ + аР-^В) 'аР-1 Р^В (/5 + аР^В)-1 ,
V -()8 + аР-1В)-1аР-1 (/? + аР_1В))' 1
Введем обозначение 0(s) = A(s)/3(s) + c*(s)B(s) (mxm - полиномиальная матрица). Тогда можно преобразовать выражение (16) для Z-1 с учетом того, что
(/3 + аР-1В)=A(s) (A(s)jS(s)+a(s)A(s)Р^В)-1 = = A(s) (A(s)0(s) + a(s)B(sí))_1 = A(s)0~1(s),
i _ / P1 -P-1BA(s)0~1(s)a(s)P-1 P~1BA(s)&~~1(s) ~ 1 —Л(я)©-1 (s)a(s)P_1 ^(s)©-1^)
P-1 -B(s)e~1(s)a(s)P-1 В (s)&~1(s) -A(s)e~1(s)a(s)P-1 Aisje-^s)
Окончательно, используя найденное выражение для матрицы Z-1, получим выражения для передаточных матриц Fx и Fu через введенный параметр Ф(в):
Fx = РХН - BCs)©-1^)«^)?-^ + В(5)0-1(5)Ф(З) = = P-1H + B(s)©-I(s) (Ф(s)-a(s)P~1H), Fu = -A(s)e-1(s)a(s)P-1H + А(з)0~1(в)Ф(з) = {
= ^(s)©-1^) (Ф(в) - a(s)P_1H).
Подставим их в рассматриваемый функционал (14):
joо
Ji = Yj I Sp [((ИГР"1 + (Ф* - ITP"1«**) в"1 в;) R (р_1н +
-joo
+ В,©-1 (Ф—аР_1Н)) +с20 (Ф*-Н*Р"V) ©^QA,©"1 (Ф—аР_1Н)) S/] ds. Для первой вариации имеем
M = i/sp
joo
ds,
-JOO
здесь {} = [Ф*©71В*КВв0_1Ф + Ф^^В^ЩР^Н - BsQ^P^HH
+ с§ф*©-1а;ра;;0-1ф -с^ф*©;1^^©-1«?-1!!] sf или
JOO
= / Sp^Fi + F^]de, (1S
¿3 J
-joo
где Fi - Q-1 (G_SGS©-1 (Ф - aP-xH) + BJRP^H) S/. 72
Отметим, что при обращении в нуль первого слагаемого в (18), второе также обратится в нуль, вследствие чего далее рассматривается только первое слагаемое.
Из равенства G_sGs0_1 (Ф - аР_1Н) + B*RP_1H = 0 следует, что выражение для варьируемой функции, обращающей в нуль первую вариацию функционала, имеет вид
Ф =aP-1H-0(G_sGs)-1B;RP1H. (19)
Подставляя (19) в (17), получим выражения для передаточных матриц
F„ = Л©1 (Ф - оР_1Н) = Л,©"1 (аР-1Н - @(G_SGS)_1B*RP-1H - аР^Н) = - -A(s)(G(-s)G(s))-1B'(-s)RP-1H = — (G(—s)G(s))-1B'(—s)RH(s), Fx = P XH + Bs©_1 (Ф - qP_1H) - P XH + B,©1 (-©(G*G)~1B*RP~1H) = = P-XH - BS(G*G)-1B*RP-1H = - B(s)(G(—s)G(—s))_1B/(—s)R)H(s),
что полностью совпадает с (15). Лемма доказана.
Теорема 2. Абсолютный минимум критерия (6) определяется соотношением
joо
Jam = Yj / Sp{{F'xo(s)IiFx0(s) + c20F'u0(-s)QFu0(S))Sf(s)}ds,
—joо
где F*0 и Fuo вычисляются по формулам (15).
Доказательство. На основании теоремы 1 определим минимальную величину Jami которую обеспечивают функции x(í) и u(í), удовлетворяющие уравнениям (10). Пользуясь понятием элементарного гармонического колебания [5], можно показать, что
оо оо
/• í М'(—jw)RM(jw) к /■_ Г L'(—jw)QL(jw) 1 ,
<xRx>=/Sp *n ^<u Qu>=JSp I
o o
(S^ - спектральная плотность функции f). После перехода в комплексную область s = juj получим минимальное значение
joо
Jam = Yj i Sp{{*'A-s)K*Ás)+cl*'u(-s)Q*u(s))Sf~(s)}ds, (20)
—j оо
где
Фх (в) - (Н(в)-В(в) (G(-s)G(s))-1 B'H)RH(í)) /A(s), Фи (s) = - (G(—s)G(s))-1 B'(-e)RH(s).
Сопоставляя (20) с (15) при условии f = f и с учетом того факта, что для рассматриваемых возмущений спектральная плотность процесса совпадает со спектральными плотностями отдельных реализаций, приходим к выводу о том, что Jam — J\.
Кроме того, согласно (15), функции x(í) и u(í), соответствующие минимуму (14), удовлетворяют уравнениям (10), т. е. одновременно обращают в нуль первую вариацию
функционала (9), являясь тем самым необходимым условием экстремума для функционала (6). Как отмечено в [11], для среднеквадратичных функционалов необходимое условие экстремума и достаточное, и, в силу неограниченности функционала сверху, при обращении первой вариации функционала в нуль достигаемый экстремум есть минимум среднеквадратичного функционала. Теорема доказана.
Полученное значение может использоваться в качестве нижней оценки среднеквадратичного функционала для любых допустимых множеств регуляторов в задаче с многомерным управлением и возмущениями неполного ранга. При этом нет необходимости непосредственно решать задачу синтеза оптимального управления.
Summary
Pogojev S. V. Mean-square functional lower estimation for MIMO-problem.
Lower estimation of minimal value of mean-square functional is given. It allows to estimate system optimization efficiency without the synthesis problem solution.
Литература
1. Веремей E. И. Спектральный подход к оптимизации систем управления по нормам пространств Н'2 и Ноо // Вестн. С.-Петерб. ун-та. Сер. 10: Прикладная математика, информатика, процессы управления. 2004. Вып. 1-2. С. 48-59.
2. Doyle J., Francis В., Tannenbaum A. Feedback control theory. New York: MacMillan, 1992. Vol. XI. 227 p.
3. Francis B. A. A course in Hoc control theory. Lecture Notes in Control and Information Sciences. Berlin: Springer, 1987. Vol. 88.
4. Bosgra O.H., Kwakernaak H., Meinsma G. Design methods for control systems. Notes for a course of the Dutch Institute of Systems and Control. Delft: Dutch Institute of Systems and Control, 2005. 325 p.
5. Петров Ю. П. Оптимизация управляемых систем, испытывающих воздействие ветра и морского волнения. Л.: Судостроение, 1973. 216 с.
6. Веремей Е. И. Абсолютный минимум среднеквадратичного критерия качества в задаче синтеза со скалярным возмущением // Изв. вузов. Приборостроение. 1989. Т. XXXII, № 1. С. 10-15.
7. Зубов В. И. Лекции по теории управления. М.: Наука, 1975. 495 с.
8. Воронов А. А. Устойчивость, управляемость, наблюдаемость. М.: Наука, 1985. 335 с.
9. Дезоер Ч., Видьясагар М. Системы с обратной связью: Вход-выходные соотношения / Пер. с англ. А. С. Берштейна; Под ред. Ю. С. Попкова. М.: Наука, 1983. 278 с.
10. Воеводин В. В., Кузнецов Ю. А. Матрицы и вычисления. М.: Наука, 1984. 320 с.
11. Алиев Ф. А., Ларин В. В., Науменко К. И., Сунцев В. Н. Оптимизация линейных инвариантных во времени систем управления. Киев: Наукова Думка, 1978. 327 с.
Статья поступила в редакцию 11 декабря 2005 г.