УДК 519.3
Вестник СПбГУ. Сер. 1, 2005, вып. 3
С. К. Мышков
ЛИНЕЙНО-КВАДРАТИЧНАЯ ОПТИМИЗАЦИЯ СИНГУЛЯРНО ВОЗМУЩЕННЫХ СИСТЕМ УПРАВЛЕНИЯ С НЕПОЛНОЙ ИНФОРМАЦИЕЙ*
Проблемам исследования и оптимизации сингулярно возмущенных систем управления (СВСУ) уделяется пристальное внимание после публикации фундаментальных работ А. Н. Тихонова [1] и его коллег [2]. Проблематика по данной теме изложена в обзорных статьях [3, 4], к тому же в них имеется обширная библиография отечественных и зарубежных авторов. Наиболее существенное продвижение по части аналитических результатов и численного моделирования достигается в линейно-квадратических задачах управления. Естественно, это отражается и в количестве публикаций.
На практике синтез систем управления ограничен необходимостью конструирования управления «по выходу», когда доступна только часть координат состояния объекта. Более того, нередко требуется предельная простота регулятора, в котором допустимо использование разве лишь текущих («мгновенных») измерений координат состояния, так что исключается возможность применения фильтра Калмана—Бьюси, полных и неполных компенсаторов Луэнбергера [5] и других аналогичных подходов. В СВСУ необходимость управления «по выходу» продиктована также естественным разделением сложного движения объекта на быстрые и медленные (доминирующие) моды. В [6], где классическая линейно-квадратическая задача рассмотрена применительно к СВСУ, предложена специальная конструкция степенных рядов по малому параметру, что позволяет получить асимптотические представления для решения уравнения Рик-кати, а затем по главным членам определить порядок близости редуцированной задачи к оптимальному решению исходной задачи. Однако неполнота информации о координатах состояния, по существу, делает невозможным использование этих результатов, впрочем так же, как и в классическом случае [7, 8]. Поэтому необходима коррекция классической задачи.
В данной работе используется модификация задачи аналитического конструирования регулятора (АКР), связанная исключительно с усреднением квадратичного функционала по множеству начальных состояний объекта; при этом не теряется возможное, хотя и при достаточно жестких ограничениях, решение, которое оптимально для любого начального состояния объекта [7, 8]. Исследуется общий случай конструирования линейного регулятора, в котором задействованы измерения только доминирующих координат, причем информация о них может быть неполной; случай полной информации рассмотрен в [9]. Получены условия разрешимости линейно-квадратической задачи с неполной информацией в новой постановке; они содержат систему из трех уравнений, два из которых типа уравнения Ляпунова, а третье определяет искомый матричный коэффициент регулятора. Решение этих уравнений представимо в форме рядов по малому параметру, причем один из рядов подобен предложенному в [6], а два другие — стандартные. Выведены выражения для главных членов асимптотических разложений искомых решений. Показано, что для матричного коэффициента усиления указанное выражение совпадает с решением редуцированной задачи, а это повышает практическую значимость полученного в работе управления «по выходу».
* Работа выполнена при финансовой поддержке РФФИ (грант №03-01-00668).
© С. К. Мышков, 2005
1. Постановка задачи и условия оптимальности. Функционирование линейной стационарной сингулярно возмущенной системы управления с неполной информацией при отсутствии внешних возмущений и ошибок измерения описывается следующими соотношениями: — уравнения движения
х 1 = Рп + Р^х2 + QlU, ¡ЛХ 2 = Р21Ж1 + Р22 Х2 + Q2U,
Х1(0) = Ж10,
Ж2(0) = Ж20;
измерения
управление по выходу
г = Н1Х1;
= Мг.
(1) (2)
(3)
(4)
Здесь ¡л — малый параметр, 0<л^1; Х1 <еКП1 ,Х2<ЕЯП2 —векторы из координат состояния, п1+п2=п; п^Кт —вектор управления; 2<ЕКт —вектор измерений (выход), т<п1; £>0 — время. Исследуется стационарный случай, когда матрицы Р^от £ не зависят, причем гапк(Н1)=т. Известно [1, 2], что при ¡^0 первые П1 координат состояния— это медленные (доминирующие) переменные, а остальные П2 координат — быстрые. Из (3), (4) следует, что управление в системе осуществляется по «медленным модам», причем при т<П1 информация о доминирующих координатах неполная.
Для компактности изложения потребуется другая форма записи исходных соотношений, которая эквивалентна (1)—(3), а именно:
Х = Рх + Qu, ж(0)=жо, 2 = Нх,
(5)
(6)
где
х= х1 , Р=
х2
1М
Р11
21
Р12
— Р22
М 22.
Q=
Ql
н = [н 0.
Целью управления является асимптотическая устойчивость замкнутой системы управления (ЗСУ)
Х = (Р + QMH )х, (7)
поэтому класс допустимых управлений и составляют линейные регуляторы (4) с матрицей МеМ, где М={МеRTxm\ReXi(P+QMH)<0, ге[1 : п]}. По причинам, изложенным в [8,10], качество стабилизации оценивается функционалом вида
с
1 (и) = Jp(xо)dxо J(х*Ах+х*Би+и*Б*х+и*Си)&.
(8)
Здесь А, Б, С — вещественные матрицы, причем А — неотрицательно определенная (А>0), а С — положительно определенная (С>0); знак * —операция транспонирования. Множество ПеRn — некоторая окрестность начала координат и 0пеШ П, причем случай П=Rn не исключается, а весовая функция р(хо)еС(П),р(хо)>0 УхоеП. Предполагается, что существует матрица
Хо=
Хп
Х21
Х12
Х22
= Jр(хо)хох^,хо, Хо > 0.
Замечание 1. Если дополнительно предположить, что /p(xo)dxo=1, то хо можно трак-
п
товать как случайный вектор со значениями из П и плотностью распределения р(хо). При этом получаем одну из постановок стохастической задачи АКР. Методы решения таких задач используют в (4) оценку координат состояния (фильтр Калмана—Бьюси), модифицируя исходную детерминированную задачу к условиям применимости теоремы разделения [11]. Отметим, что имеются и другие модификации классической задачи АКР для «управления по выходу» [8].
В рассматриваемой задаче случай т=П1,В=0 исследован в [9], причем существенным моментом исследования оказалось то обстоятельство, что для редуцированной системы задача оптимальной стабилизации превращается в классическую задачу АКР с известным решением [7]. Случай т<п\,В=0, рассмотренный ниже, существенным образом обобщает полученные в [9] результаты. При этом для редуцированной системы получаем задачу АКР с неполной информацией, которая к тому же усложнена наличием смешанных слагаемых в критерии качества, как это имеет место в (8).
Пусть М=0. Тогда при М€М несобственный интеграл в (8) сходится и критерий качества принимает следующее значение:
7 (и) = ^ [0(М) Х0] =1(М), (9)
где ^ — операция «след матрицы», а 0(М) —решение алгебраического уравнения Ляпунова
0[Р + QMH] + [Р + QMH]*0 + Ш (М) = 0
с матрицей
Ш (М ) = А + ВМН +(ВМН)* + (МН)*СМН. (10)
Задача (1)—(8) представляет собой задачу оптимальной в среднем стабилизации сингулярно возмущенной системы [8]. Управление иос = Мосг, при котором функционал (8) принимает наименьшее возможное значение, называется оптимальным в среднем управлением. Условия разрешимости задачи (1)—(8) даются в следующем утверждении.
Теорема 1. Если допустимое управление иос=Мосг оптимально в среднем, то система уравнений
0(Р + QMH ) + (Р + QMH )* 0 + Ш (М ) = 0, (11)
Ь(Р + QMH )* + (Р + QMH )Ь + Хо = 0, (12)
М = -C-1(Q*0+B*)LH*(HLH*)-1 (13)
необходимо имеет вещественное решение в виде положительно определенных матриц 0^ и матрицы М€М.. При этом (13) —это искомое .значение матрицы Мос.
Замечание 2. В подынтегральном выражении функционала (8) имеются «смешанные» слагаемые, зависящие одновременно от х и и. В связи с этим условия оптимальности (11)—(13) отличаются от ранее опубликованных и получаемых из (11)—(13) при В=0 [8,12].
Замечание 3. Если множество М непусто и квадратичная форма в (7) положительно определенная, то задача (1)—(8) разрешима, т.е. существует вещественное решение 0, L, М уравнений (11)—(13), обладающее указанными в теореме 1 свойствами [10]. Для отыскания оптимального значения Мос€М можно использовать как традиционные численные методы безусловной оптимизации (покоординатный спуск, различные варианты
градиентных методов и др.) [10], так и специальные итерационные процедуры, разработанные применительно к задаче оптимальной стабилизации с полной [7] и неполной [12] информацией о координатах состояния.
2. Редуцированная задача оптимальной стабилизации. Эта вспомогательная задача описывается следующими соотношениями:
Р8х8 + Qsus, х, (0)
2 = Н\Х8, пя = Ыяг,
: Х10,
(14)
(15)
(16)
СЮ
Js(us) = Jp(xo)dxo J(х*А з Хs +Н Х s BsUs+u*B*s Хs+u*sCs Us)dt. (17)
Здесь
Ps = Р11 - Р12Р22Р21, Qs = Ql - Р12P221Q2 Ал = Ац - Л12Р-1Р21 - (^12Р-1Р21 Г + (Р221Р21)*А22Р-^!, Bs = -А12 P221Q2 + (Р-21Р21 ГА22 P221Q2-B2], Cs = C+(P221Q2)*A22 Р22^2-(Р22^Г B2-B22
Кроме того, используется разбиение матриц А, B функционала (8) на блоки вида
'Аи А12 \ „ fBl"
(18)
(19)
(20) (21)
А=
А122 А22
B =
B2
аналогичное разбиению матриц Р, Q. Соотношения (14)—(21) получаются из (1)—(8) в результате предельного перехода при после известных стандартных преобразований [3, 9]. При этом предполагается, что Р22 —гурвицева.
Пусть система (14)—(16) стабилизируема, т.е. существует МлСЯтхт, Ms=0 такое, что для всех Ms^M.s матрица замкнутой системы управления (Ps+QsMsHl) будет гурвицевой. Пусть также квадратичная форма функционала (17) положитльно определенная относительно (Хз,из). Положим
Ws(Ms)=As+BsMsHl+(Bs М,Н1)2+(М,Н1)2 СЗМ,Н1.
Тогда существует оптимальное в среднем управление из=Мзг [10]. В соответствии с теоремой 1 матрица Мз совместно с симметричными матрицами ©з>0,Ьз>0 необходимо является решением следующей системы уравнений:
©з(Рз+QsMsHl )+(Рз+QsMsHl )2Os+Ws(Ms) = 0, Ls(Ps+QsMsHl)2 + (Р,+QsMsHl)Ls+Xll = 0,
Ms = -Cs-1(Q2©s+Bs2)LsH12(Hl LsH21)-1.
(22)
(23)
(24)
При этом (24) — это искомое значение матрицы Мз.
Соотношения (22)—(24) в случае т=П1 превращаются в условия оптимальности для классической задачи АКР, причем остаются только два из трех — уравнение (22) для матрицы ©л и определяющее равенство (24) для матрицы Ms, которое можно преобразовать к виду А4л = -Cs2l(Q2©s + Bs2) (при условии rank(Hl)=nl можно положить
л
Hl=Em). Затем после исключения М8 из (27) получаем известное уравнение Риккати для матрицы 0Я. Что касается методов решения нелинейных уравнений (22)—(24), то здесь нам остается разве лишь сослаться на замечание 3.
3. Главные члены оптимального решения. Предположим, что матрица Р22 — гурвицева, редуцированная система (14)—(16) — стабилизируема и квадратичная форма функционала (8) положительно определенная по (х,и). Тогда задача (1)—(8) разрешима и искомое решение доставляется уравнениями (11)—(13) как функции 0(р)^(р>),Мос(р>),^>£(0, ¡1). Будем искать эти матрицы в виде рядов [6, 9]:
0 = 0(.)
© 11 I© 12
М©12А+( ©
М©22/
^ к!
к=1
(к) 11
¡0Г
¡0{2к2\
(25)
L11 L12
~ ..к ( Г (к) т(к)\
(26)
IIк
к=1
(27)
Коэффициенты рядов (25)—(27) определяются стандартным образом после подстановки этих рядов в (11)—(13) и последующего приравнивания коэффициентов при одинаковых степенях С этой целью уравнения (11), (12) предварительно запишем в поблочном виде. Тогда уравнению (11) будет соответствовать система из трех таких уравнений:
011 (Р11+QlMHl)+(Pll+QlMHl)* 011 +.-1012(Р21 +Q2MHl)+
+|-1(Р21 +Q2MHl)*0*2+All +BlMHl+(BlMHl)*+(MHl)*CMHl=0, (28)
011Р12 +|-1012 Р22 + (Р11 +QlMHl)* 012+|-1(Р21 +Q2MHl)* 022+А12 + (B2MHl)*=0,
(29)
(30)
0*2 Р12+Р*2 012+|-1022Р22 +|-1Р2*2 022 + А22 = 0.
После подстановки рядов (25), (27) в (28)—(30) и приравнивания коэффициентов при ¡0, получаем систему уравнений для определения главных членов асимптотических представлений блоков матрицы 0(|):
011(Рц+QlM ^ЩРи+QlЛ© Hl)* 011+012 (Р21+Q2Л© Hl)+
+(Р21 +Q2Л©Hl)*0 *2+Аи +BlЛ©Hl+(BlЛ©Hl )*+(М Hl)*cMHl=0, (31)
© 11Р12 +© 12 Р22 + (Р21 +Q2Л© Щ)* © 22+А12 + В2М Щ)* =0, © 22 Р22+Р2*2© 22 + А22 =0.
(32)
(33)
Поскольку матрица Р22 —гурвицева, уравнение (33) определяет матрицу ©22 единственным образом, при этом ©22 не зависит от матрицы М и ©22 >0, если только А22 >0. Далее, так как матрица Р22 — неособая, то из (32) находим
© 12=- © 11Р12+Р21+Q2MHl)*©22+А12+(B2^IHl)*
Р
-1 22 .
(34)
Подставив (34) в (31) и используя (33), после ряда несложных преобразований уравнение (31) приведем к виду
© 1 1(Рл +QsMMHl )+(Ps+QsMMHl )2© 1 ^л(М)=0. (35)
Здесь матрицы РлWs определены как в п. 2.
Запись уравнения (12) для матрицы L в поблочном виде дает следующую систему:
(Р11 +QlMHl)Lll +Р12 L22+Lll (Рц +QlMHl)2+Ll2Pl22 +Хп =0, (36)
(Р11 +QlMHl)Ll2+Pl2L22+M-1 [Lll(P21 +Q2MHl)2 + Ll2P222]+Xl2=0, (37) М-1 [(Р21 +Q2MHl)Ll2+L22(P21 +Q2MHl)2 +Р22 L22 + L22P222]+X22=0. (38)
Подставим ряды (26), (27) в (36)—(38) и, предварительно домножив (37), (38) на приравняем коэффициенты при /0. Тогда для определения главных членов разложения (26) получим уравнения
(Р11+QlMMHl)L 1+11(^1^^ Hl)2+Pl2 Ll2+L 12Р12 +Х11 = 0, (39)
Lll (Р21 +Q2Л^ Hl)2+L 12Р22 =0, (40)
(Р21+Q2^IHl)L l2+L22(P2l+Q2^IHl)2+L 22Р222+Р221,22=0. (41)
В силу неособенности матрицы Р22 из (40) найдем
L12 = ^ 11 (Р21 + Q2M щ)2 Р2-1. (42)
Подставив (42) в (39), после несложных преобразований и с учетом равенств (18) получим
(Рз +QsM Hl )L 1^11 (Ps+QsMM Hl)2+Xll=0. (43)
С целью определения главной части матрицы Moc(/) запишем уравнение (13) в следующем виде:
©+B2)LH2+CMHLH2 = 0. (44)
Уравнения (13) и (44) эквивалентны, но (44) предпочтительнее для последующих преобразований. С учетом блочного представления матриц ©, L, Q, H, B в рассматриваемой сингулярно-возмущенной задаче АКР, уравнение (44) можно записать так:
^©п+М-^©!^!)LllH1+(Q!©l2+м-1Q2©2^2)L12H1 +CMHlLllH1 =0. (45)
Подставив в (45) ряды (25)—(27) и выделив слагаемые порядка /0, получим
№1© ll+Q2 © 2^2^11 щ+(Q2© 22+B22 )L 22н!+cMHlL ия1=0. (46)
Заменяя здесь © 12,-^12 согласно (34),(42), а затем группируя слагаемые с учетом обозначений (18)—(21), уравнение (46) приведем к виду
^ © 11+Bl )L llHl+CsM HlL llHl=o.
Так как матрицы Cs, HlLц^ —неособые, отсюда находим
М = © 11 +B1)L llH1(Hl ^ llH1)-1. (47)
Сопоставляя (22)—(24), соответственно, с (35), (43), (47), приходим к заключению, что матрицы (Qs,Ls, Ms) и (<Э11, L11, M) определяются одними и теми же уравнениями, а потому их решения совпадают, т.е.
М = Ms, Э11 =es,L 11 = Ls. (48)
Значения (48) для матриц M,Э11, Lц однозначно определяют по формулам (34), (42) матрицы Э12, L12 и матрицу L22 как единственное решение уравнения (41), тем самым завершая вычисление главных членов асимптотических представлений (25)-(27).
Теорема 2. Если .матрица P22 — гурвицева, квадратичная форма критерия качества (8) положительно определенная и редуцированная система (Ц)-(166) стабилизируема, то задача оптимальной в среднем стабилизации (1)-(8) разрешима и асимптотические представления искомых решений имеют вид
Moc = Moc(M) = Ms + О1 (/), (49)
J (uoc)= tr(es Xn)+O2(p), (50)
где 01(м),02(м) — соответственно, матричный и скалярный степенные ряды, начинающиеся с членов порядка /л1, при этом 02(/)>0,/g(0, /).
Практическая значимость равенств (49), (50) состоит в том, что они позволяют определить главную и при том не зависящую от хотя и малого, но трудно определимого параметра / часть. Тем самым они дают возможность уже на стадии проектирования исследовать «в основном» свойства полученного оптимального решения, поскольку редуцированная задача оптимальной стабилизации, как правило, существенно меньшей размерности, чем исходная задача, и требует меньших затрат.
Заключение. Методы исследования и оптимизации сингулярно возмущенных систем управления (СВСУ) характеризуются определенной спецификой и опираются на асимптотические представления решений. Специфика СВСУ проявляется в разделении движений на «медленные» и «быстрые». Это обусловлено тем, что соответствующие им моды имеют порядки 0(1) и 0(1//). Естественно возникает потребность раздельного управления по быстрым и медленным модам.
В работе исследован общий случай управления по доминирующим координатам, причем информация о них неполная, с квадратичным критерием качества, усредненным по множеству начальных состояний объекта. Получены условия существования оптимального в среднем управления, на базе которого строится решение исходной и редуцированной линейно-квадратичных задач стабилизации. Показано, что главные члены асимптотических представлений для матричного коэффициента усиления регулятора и оптимального значения функционала в исходной задаче совпадают с точными значениями аналогичных величин для редуцированной задачи. Ввиду того, что редуцированная задача имеет меньшую размерность, полученные результаты могут успешно и вполне обоснованно применяться в прикладных задачах управления.
Summary
S. K. Myshkov. Linear-quadratic optimization of singular pertubated control systems with incomplete information.
The problem of optimizing a lenear singular pertubated system with a quadratic performance index subject to the condition of incomplete feedback control by dominated coordinates is considered.
The necessary conditions of optimal control have been obtained and the main terms of asymptotic expansions by the small parameter method are determined. It's proved that the main terms can be calculated by the solution of the corresponding reduced mean-optimal stabilisation problem and it gives us the opportunity to investigate optimal solution properties of the initial problem.
Литература
1. Тихонов А. Н. Системы дифференциальных уравнений, содержащие малые параметры при производных // Математический сборник. 1952. Том 31(73), №3. С. 574-585.
2. Васильева А. Б., Бутузов В. Ф. Асимтотические разложения решений сингулярно возмущенных уравнений. М.: Наука, 1973. 272 с.
3. Васильева А. Б., Дмитриев М. Г. Сингулярные возмущения в задачах оптимального управления // Итоги науки и техники. Сер. Математический анализ. ВИНИТИ. 1982. Том 20. С. 3-78.
4. Kokotovic P. V. Applications of singular perturbation techniques to control problems // SIAM Review. 1984. Vol.26, N4. P. 501-550.
5. Квакернаак Х., Сиван Р. Линейные оптимальные системы управления / Пер. с англ. М.: Мир, 1977. 652 с.
6. Chow J. H., Kokotovic P. V. A Decomposition of Near-Optimum Regulators for Systems with Slow and Fast Modes // IEEE Trans. Automat. Contr. 1976. Vol.21, N5. P. 701-705.
7. Зубов В. И. Лекции по теории управления. М.: Наука, 1975. 492 с.
8. Мышков С. К. Оптимальная в среднем стабилизация линейных управляемых систем // Вестник ЛГУ. 1971. №7. С. 90-97.
9. Кабакова Е. В., Мышков С. К. Стабилизация сингулярно возмущенных систем управления с неполной информацией // Вестник С.-Петерб. ун-та. Сер. 1. 2003. Вып. 2 (№9). C. 27-33.
10. Мышков С. К. Линейные управляемые системы с неполной информацией о координатах состояния // Негладкие задачи теории оптимизации / Под ред. В. Ф. Демьянова. Л.: Изд-во ЛГУ. 1982. С. 248-272.
11. Wonham W. M. On the separation theorem of stochastic control // SIAM Journal on Control. 1968. Vol.6. N2. P. 312-326.
12. Levine W. S., Athans M. On the determination of the optimal constant output-feedback gains for linear multivariable system // IEEE Trans. Automat. Contr. 1970. V. AC-15. N1(Feb). P. 44-48.
Статья поступила в редакцию 19 апреля 2005 г.