УДК 517.977.5
О СПЕКТРАЛЬНОМ ПОДХОДЕ К ЬОС-ОПТИМИЗАЦИИ ДИНАМИЧЕСКИХ ОБЪЕКТОВ
Е.И. Веремей
В работе предлагается специальная спектральная форма представления решения задачи LQG-оптимального синтеза стабилизирующих обратных связей для линейных стационарных систем, связанная с оптимизацией в пространстве Н2. Применение этой формы существенно сокращает время вычислений и упрощает исследование передаточных функций оптимальных регуляторов
Ключевые слова: LQG-оптимизация, синтез, функционал, Н-теория, объект управления, регулятор, спектральный метод
Введение. Одним из широко используемых подходов к решению практических задач по моделированию, исследованию и проектированию систем управления динамическими объектами служит теория среднеквадратичного оптимального синтеза [1-3]. Она объединяет математические методы и алгоритмы поиска регуляторов, обеспечивающих максимальное подавление влияния внешних возмущающих факторов на желаемые движения систем.
В частности, начиная с 60-х годов прошлого века, пользуется популярностью идеология LQG-оптимизации [2, 3] в рамках которой внешние возмущения и помехи в измерениях трактуются как гауссовские белые шумы. Привлечение этого подхода оправдано в тех ситуациях, когда отсутствует информация о реальном спектре возмущающих факторов, что делает естественным их представление белыми шумами.
В развитии теории среднеквадратичного синтеза особая роль принадлежит циклу исследований, представленному в [2], где использован эффективный специальный метод параметризации множества стабилизирующих регуляторов. В рамках близкого подхода в статьях [4, 5] предложена новая спектральная форма представления оптимальных регуляторов, упрощающая их анализ и синтез.
Значимость этой формы проявилась в связи с бурным развитием методов H -теории, к которой в современной трактовке принадлежат и задачи среднеквадратичного синтеза [6, 7]. Оптимизация по нормам пространств H2 и H¥ обеспечена весьма эффективной программной поддержкой, в частности - средствами популярной среды MATLAB.
Конечной целью данной работы служит развитие аналитического и, в особенности, вычислительного аппарата LQG-оптимального
Веремей Евгений Игоревич - СПбГУ, д-р физ.-мат. наук, профессор, e-mail: e [email protected]
синтеза, основу которого в настоящее время составляют «2-Риккати» и LMI подходы [6].
При этом используются те возможности, которые предоставляет спектральная форма для существенного сокращения длительности вычислений, что исключительно важно при адаптивной настройке в режиме реального времени для встраиваемых систем и подвижных объектов с существенно ограниченными ресурсами автономных вычислительных устройств.
Постановка задачи. Будем рассматривать SISO задачу LQG-оптимального синтеза для динамических объектов с моделью x = Ax + bu + pj(t),
, ч Г (1)
y = cx + y(t), x = cx,
где xe En - вектор состояния, X,У,u, j,ye E1, X, y - контролируемая и измеряемая переменная, u - управление, j(t) - возмущение, y(t)
- шум в измерениях. Компоненты матрицы A и векторов b, p, с будем считать постоянными,
а пары {A, b} и {A, с} вполне управляемой и наблюдаемой соответственно. Функции j(t) и y(t) будем трактовать, как взаимно не коррелированные гауссовские белые шумы: спектральная плотность мощности первого из них
2
равна единице, а второго - константе g .
Наряду с уравнением (1) введём линейную модель регулятора
u = W(p)y , (2)
где W(p) = W1(p)/W2(p), причем Wr,W2 - полиномы, p = d / dt. Будем рассматривать среднеквадратичный функционал
I = I (W) = (X 2) + k 2(u 2), (3)
который задан на движениях замкнутой системы (1), (2), k = const. Заметим, что указанная система имеет два входа (j, y) и два выхода (X, u) , однако ее нетрудно свести к эквивалентному SISO варианту. Действительно, введем
следующие обозначения для передаточных функций системы (1), (2) от каждого входа к каждому выходу:
РфХ(5) = Р /(А - БЖ), (5) = БЖ/(А - БЖ), (4)
^ (5) = РЖ/(А - БЖ), Руи (5) = АЖ/(А - БЖ) Здесь также использованы обозначения А(5) = det(E,5 - А) Б(5) = А(5)е(£5 - А)-1 Ь, (5) Р(5) = А(5)е(Е5 - А)-1 р .
С учетом обозначений (4) и (5), можно преобразовать функционал (3), переходя в частотную область:
= I (W) =1 f| H (jw,W )|2 dw, nJ
(6)
где Н = Н(я, Ж) - передаточная функция замкнутой системы, определяемая соотношением
%Х(
H(jw, W)|2 ° |F_*(jw)|2 + к2|Fju (jw)|2 +
+
(7)
1 Рух(М* + к 2| руи(7®)|2 ]ї2.
Поставим задачу о поиске регулятора, ми-нимизирущего функционал (3) на множестве стабилизирующих обратных связей (2):
I = I(W) =1 f |H(jw, W)|2dw ® min .
p J Wen,
(8)
Нетрудно видеть, что поставленная задача
(8) есть не что иное, как 8КО-вариант популярной задачи LQG-оптимального синтеза [2, 3, 6], который сводится к вопросу минимизации нормы передаточной функции замкнутой системы в пространстве Харди Н2 .
Действительно, введём в рассмотрение множество ЯЬ рациональных дробей р(я), не имеющих полюсов на мнимой оси, определяя на нем произведение и норму по формулам
(р1, р2> = 2- | Рх(-7®)р2( М ^ ,
dw.
(9)
и образуем гильбертово пространство ЯЬ2 строго правильных функций р(я) е ЯЬ , которое можно представить в виде
ЯЬ2 = ЯН2 © ЯНг , (10)
где слагаемое ЯН2 содержит все функции р(я) аналитические в правой полуплоскости, а его ортогональное дополнение ЯН2 - в левой.
Полагая, что обобщенная передаточная функция Н = Н(я,Ж) замкнутой системы (1),
(2) принадлежит пространству ЯН2, имеем
I = I (W) =1 f | H (jw, W )|2 dw = ||H (s, W )| p J
т.е. задача (8) эквивалентна задаче о минимизации нормы функции H :
I = H(W)||2 ® min, W2 ={ W: H(W) e RH2}. (12)
2 WeW2
Параметризация допустимого множества. Необходимо отметить, что непосредственное решение задач (8) или (12) затруднено нелинейной зависимостью функционалов от искомых функций W. Эта трудность снимается одним из способов параметризации множества Ws, представленных, например, в работах [3,6]. В частности, следуя [3], введем варьируемые параметры F(s) с помощью соотношений
W = Lf(Ф) = AF-a ,ф = LJ(W) = a + ßW , (13) ' BF + ß’ ^ 7 A - BW,K f
где a(s), ß(s) - любые полиномы, для которых
гурвицев полином
Q(s) = A(s)ß(s) + B(s)a(s). (14)
Формулы (4) и (13) позволяют выразить
передаточные функции замкнутой системы в
зависимости от параметра F(s):
Fjx = P(BF + ß)/Q,Fyx = B(AF-a)/Q, (15) FjU = P(AF-a)/Q ,Fyu = A(AF-a)/Q. Введем в рассмотрение допустимое множество Wф = L-f1(W2) параметров F(s), имеющих гурвицевы знаменатели. Тогда легко показать, что задача (12) эквивалентна задаче
12 = I2 (Ф) = I(Lf (Ф)) = |H(Ф)2 ® min , (16)
ФеОф
где функция H , в соответствии с (7), задается следующим тождеством (черта «-» обозначает замену « s » на « - s »):
H(F)H(Ф) ° Fjx (Ф)Fjx (Ф) + k 2Fju (F)Fju (Ф) +
+ [Fyx (F)Fyx (Ф) + k 2 Fyu (Ф) Fyu (F)]g2. (17)
Лемма 1. Тождество (17) может быть представлено в виде
H (Ф)Я (Ф) = (T - T2F)(T - Т2Ф) + T3, (18)
где дробно-рациональная функция Tj(s) с гур-вицевым знаменателем и функции T2(s) e RL, T3(s) e RL определяются формулами
T =(k2aA-ßB)D/(GQ) + g2AB /(GD),
T2 = GD / Q, (19)
T3 = k2 DD /(GG )+g 2(BB - k2 AA )/(GG )--g4AABB /(GGDD).
Здесь полиномы G(s) и D(s) являются гурвицевыми результатами факторизаций
к2 АЛ + ВВ ° ОО, у2АЛ + РР ° ВВ . (21)
Заметим, что лемма 1 позволяет использовать для решения задачи (16) известную идею о максимальном приближении к заданным моделям [7]. Справедливо следующее утверждение.
Теорема 1. Задача (16) обеспечения минимума Н2 -нормы обобщённой передаточной функции Н = Н(5,Ф) эквивалентна задаче
Е2(Ф) = T -Тф2 ® min
(22)
ФєОф
о наилучшем приближении к заданной модели T1 по той же норме.
Следствие 1. Величина I
л Ї
nJ
T3 dw яв-
ляется нижнеи оценкой для оптимального значения функционала в задачах (12) и (16) соответственно, т.е.
I0 = min I(W) = 120 = min 12(Ф) > Ia . (23)
WeW2 ФеОф
Передаточная функция оптимального регулятора. В соответствии с теоремой 1, классическая LQG-задача сводится к задаче (22) о максимальном приближении к заданной модели в смысле достижения минимума Н2 -нормы ошибки приближения. Результат решения этой задачи одновременно даёт оптимальную функцию-параметр Ф 02(s) и по отношению к задаче (16), а применение формул (13) позволяет, в свою очередь, найти оптимальное решение задачи (12), т.е. передаточную функцию W0 = Lf (Ф02) LQG-оптимального регулятора.
Теорема 2. На множестве Оф существует единственный параметр Ф = Ф02, где Ф 02 = [(k 2aA -ßß )D - RQ]/(GGD),
(24)
ад=І
G(-s) B(-g, )N(g,)
“ §, - 5 Л(§, )Т(§, )О'(-§, ) gi, 1 = 1, п - простые корни полинома О(-5), который дает минимум ошибки приближения в задаче (23): Е(Ф02) = \\(ЯВ + у2ЛВ)/(ОБ)||2.
Формулы (13) и (24) позволяют непосредственно найти передаточную функцию оптимального регулятора в задаче (12) и выявить её существенные спектральные особенности.
Теорема 3. Регулятор (2) с передаточной функцией
№ 1 Л(5)ЭД + В(-5)В(5)] / О(-5) (25)
В(5)ВД - к2Л(-5)В(5)]/О(-5)
является единственным решением задачи (12).
Этот регулятор и замкнутая им оптимальная система обладают следующими спектральными свойствами:
1. Деление на полином G(-s) в (27) осуществляется нацело (без остатка).
2. Характеристический полином замкнутой системы имеет вид
Do(s) = - D(s)G(s). (26)
3. Минимум I0 = min I (W) функционалов (11) и (3) на множестве W 2 превышает свою
оценкуIa на величину ||(RD + y2^B)/(GD)||2.
В соответствии с теоремами 2 и 3 имеем следующий алгоритм решения задачи: вначале выполняются факторизации (21), затем по формуле (24) формируется полином R(s) и, наконец, по формуле (25) после деления на полином G(-s) определяется передаточная функция оптимального регулятора.
Пример решения задачи синтеза. Рассмотрим уравнения (1) объекта управления с заданными матрицами
f -1 0 -1 1 f 0 1 f - 21
A = СО - (N 0 , b = 1 , Р = 1
1-1 - 2 - 4 у v 0 у v 1 у
с = (0 0 1), а также функционал (3) с весовым множителем к = 1 , и будем полагать, что спектр шума в измерении определяется постоянной у2 =1 .
В результате выполнения факторизаций
(21) получаем полиномы
В(5) = 53 + 8.59052 + 22.405 +15.81,
О(-5) = -53 + 8.03652 -18.295 + 5.385, причем второй из них имеет корни gh2 = 3.846 ± 0.9225] , g3 = 0.3443.
Далее по формулам (24) и (25) находим полином Л(5) = 0.145552 -3.1985 + 3.729 и формируем оптимальную передаточную функцию
0.145552 +1.1355 + 2.410 Ж0(5) =-.---------------------------2-.
0 5 + 8.62752 + 22.715 +16.07
Естественно, что такую же передаточную функцию дает и применение классического «2-Риккати» метода.
Для сравнения времени, затрачиваемого на проведение вычислений, был осуществлен запуск данного примера в цикле по параметру к е [1: 0.2: 20]. При этом использовался единый тестирующий код на языке МЛТЬЛБ как для классического (функция lqg), так и для спектрального подхода (оригинальные функции) с фиксацией времени счета парой функций йс-1ос.
Среднее время вычислений для классического подхода составило 2.42 с, а для спектрального - 0.089 с, что свидетельствует о существенном преимуществе последнего.
Заключение. В статье рассмотрены теоретические вопросы, связанные с применимостью спектральной формы представления передаточных функций среднеквадратичных оптимальных регуляторов для решения SISO задачи LQG-оптимального синтеза. Предложен вывод указанной формы, связанный с методами теории оптимизации по норме пространства Харди Н2 . Указаны особенности подхода и исследованы спектральные свойства определяемых им решений. Приведен пример выполнения численных расчетов с использованием разработанного спектрального представления.
Практическая направленность предлагаемого подхода определяется указанием пути для существенного сокращения вычислительных затрат (в приведенном примере - в 30 раз по времени счета) по сравнению с «2-Рикккати» или LMI методами. Это, в частности, весьма значимо для адаптивной перенастройки регуляторов в рамках различных встраиваемых систем с ограниченными вычислительными ресурсами.
ПРИЛОЖЕНИЕ.
Доказательство леммы 1. Непосредственно из (17) и (15) имеем H(Ф)Н(Ф) °
°{PP [(k 2 AA + BB )ФФ + (pB - k 2aÁ )Ф +
+ (РB - к2aA)F + к2aa + pp]+
+ g2 [(АФ - a)(A Ф - a)(k2 AA + BB )]}/QQ),
что в сопоставлении с правой частью (18) дает T1T1 + T3 °{PP(k2aa + pp)+ (П.1)
+ g 2aa(k2 AA + BB )}/QQ),
T2T2 ° (k2AA + BB )(g2AA + PP )/(QQ),
-TT °{PP(pB-k2aA)--g2 aA(k2 AA + BB )}/QQ).
Второе тождество в (П.1) непосредственно дает функцию T2 (19), а из третьего при этом имеем
Т = (k2aA -pB)P/(QG) + g2AB /(GD). После подстановки найденных функций T2 и T в первое тождество из (П.1) с учётом (14) получаем и выражение для функции T3 в формулах (19), что доказывает лемму.
Доказательство теоремы 1. В соответствии с леммой 1 имеем
12(Ф) = | Н (Ф)||2 =1 Í Н|2 dw =
л J
= 1 Í Т - Г2Ф\2 + t ]dw=1 Í Т pj pj
0 0
+1Í T3 dw =1Í T - Т2Ф|2 dw+1Í 0 0
iih (Ф)2 = ikt - т2ф)і2+1 Í
p •>
- Т2Ф| dw +
T3 dw, т.е.
T3 dw. (П.2)
Второе слагаемое в формуле (П.2) не зависит от параметра Ф , т.е. минимум функционала /2(Ф) достигается тогда и только тогда, когда достигается минимум первого слагаемого, что и доказывает теорему.
Доказательство теоремы 2. Рассмотрим выражение для ошибки приближения в задаче
(22). После подстановки формул (19) имеем:
Е2(Ф) = ||(к2аЛ -рВ)В ЩО) + (П.3)
+ у2 АВ /(ОБ) - ОВФ / б\\ 2.
Выполнив деление под знаком нормы на дробь (О / О) в (П.3) с учетом ||О / О||2 = 1, имеем Е2(Ф) = ||(М -ЬФ)||2, Ь = ОБ/б,
М = (к2аЛ - рВ )В/(бО)+ у2 АВ /(ОВ )
Разложим дробь М е ЯЬ2 в сумму ортогональных элементов М2 е ЯН2 и М^ е ЯН^:
^(Ф) =1M 2 + M 21- LF\\2 =
(П.4)
=1 м 2 - ьф2+| М 21! |2.
Последнее равенство имеет место, поскольку выполняются условия ЬФ е ЯН2 и (М2 - ЬФ) е ЯН2, т.е. (М2 - ЬФ) 1М2 .
Заметим, что функции М2 и М2[ можно найти, сепарируя дробь
к2а(5)Л(-5) -р(5)В( 5 °
б(5)О(-5) ( ) (П.5)
° ВД/б(5) + Я(5)/О(-5), для чего приведём правую часть к общему знаменателю, получая при этом
к2а(5)Л(-5)В(5) -р(5)В(-5)В(5) ° ° Я,(5)О(-5) + Я(5)б(5).
Отсюда с учётом (14) и (21) находим
Я(gI) = -В(-gI )В(gI)/Л(gI), 1 = 1,п . (П.6) Далее с помощью интерполяции Лагранжа формируем полином Я(5) (24) и, считая полином Я(5) известным, на основании (П.5) и с
учетом у2ЛВ /(ОВ) е ЯН2 имеем
М2 = Ях/б = (к2аЛ-рВ)в/бО-, (П.7)
0
М1 = я/О + у2ЛВ /(ОВ).
Заметим, что для функционала Е2(Ф)2 согласно (П.4) второе слагаемое не зависит от параметра Ф , поэтому минимум достигается при условии М2 - ЬФ ° 0 , причём это равенство возможно только в случае Ф = Ф 02 = М2 / Ь , откуда с учётом (П.7) имеем (24).
В соответствии с формулой для полинома Я(5) легко показать выполнение равенств [(к2аЛ — РВ)В - Яб] = 0,(1 = 1,п) , т.е. чис-
литель функции Ф02(5) нацело делится на полином О(-5) . Но поскольку О(5) и N(5) -гурвицевы полиномы, то и знаменатель функции Ф02(5) - гурвицев полином. При этом
функционал Е2 принимает конечное значение
Е (Ф 02) = |(ЯВ + у2 ЛВ )/(ОВ)2 =
|(ЯВ + у2 ЛВ )/(ОВ)\\2, следовательно, конечна и величина ||Н (Ф)^Ц2 ,
т.е. Ф02 е Оф , что и доказывает теорему.
Доказательство теоремы 3. Из теоремы 2 следует, что функция Ф02(5) (24) - единственное решение задачи (12). Но тогда передаточная функция ЬФ (Ф02) дает единственное решение задачи (16):
Литература
1. Чанг Ш. Синтез оптимальных систем автоматического управления. М.: Машиностроение, 1964.
2. Квакернаак Х., Сиван Р. Линейные оптимальные системы управления. М.: Мир, 1977.
3. Алиев Ф. А., Ларин В. Б., Науменко К. И., Сунцев В. Н. Оптимизация линейных инвариантных во времени систем управления. К.: Наукова думка, 1978.
4. Веремей Е. И. Частотный метод синтеза оптимальных регуляторов для линейных систем со скалярным
Санкт-Петербургский государственный университет
W = AFо, -a = -Q(ART + BN)/G_
0 BF02 +p -Q(BRT-k2AN)/G ’ откуда следует (25). Заметим, что функция W0 не зависит от выбора полиномов a, b, и определяется лишь исходными данными.
Рассмотрим свойства оптимального регулятора, связанные со спектром корней
gj (i = 1,n) полинома G(-s) :
1. Учитывая формулу (П.6) для значений R( gi ) нетрудно показать, что выражения
AR + BD и BR - k2AD в комплексных точках s = gi (i = 1,n) равны нулю, т.е. в формуле (24) они делятся нацело на полином G(-s) .
2. Вводя обозначения W01 и W02 для числителя и знаменателя в (24), имеем характеристический полином A0(s) замкнутой системы:
А0 = A W02 - BW01 = (ABR - k2AAD) / G -
- (BAR + BBD) / G = -DGG / G,
откуда следует формула (26).
3. На основании следствия 1 из теорем 1 и 2 и в соответствии с формулами (П.2), (П.3), (24), имеем
I20 = min 12(W) = H (F02)ll2 = AI2 + Ia, где
WGW2
AI2 = ^2^02). Теорема доказана полностью.
возмущением (Часть 1, Часть 2) // Известия вузов СССР. Электромеханика. 1985. № 10. С. 52-57, 1985. № 12. С. 33-39.
5. Веремей Е. И. Спектральный подход к оптимизации систем управления по нормам пространств Н2 и Н¥ // Вестн. С.-Петерб. ун-та. Сер. 10. 2004. Вып. 1. С. 48 - 59.
6. Поляк Б.Т., Щербаков П.С. Робастная устойчивость и управление. М.: Наука, 2002.
7. Doyle J., Francis B., Tannenbaum A. Feedback control theory. New York: Macmillan Publ. Co., 1992.
SPECTRAL APPROACH TO LQG-OPTIMIZATION OF DYNAMICAL SYSTEMS E.I. Veremey
Special spectral form is proposed for the optimal stabilizing feedback representation in the framework of LQG-synthesis problem for linear stationary systems. Proposed approach is connected with the optimization in the sense of H2 space. The mentioned spectral form application allows essentially decrease a time of optimal controller calculation and simplify its properties analysis
Key words: LQG-optimization, synthesis, functional, H-theory, plant of control, controller, spectral approach