2013
ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА Управление, вычислительная техника и информатика
№ 2(23)
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
УДК 519.25
М.Е. Шайкин
ОБОБЩЕНИЕ ОДНОГО РЕЗУЛЬТАТА В СТАТИСТИЧЕСКОЙ ТЕОРИИ Я2/ЯМ-УПРАВЛЕНИЯ1
Получено решение задачи стохастического робастного Я2/Яж-управления динамической системой с внутренними шумами, мультипликативными по состоянию и управлению, на конечном интервале времени. Задача сводится к нахождению решения системы двух связанных матричных дифференциальных Риккати-подобных уравнений относительно матричных переменных Pi(t) < 0, P2(t) > 0.
Ключевые слова: шум, зависящий от состояния и управления, подавление возмущений, робастное управление, матричное Риккати-подобное уравнение.
Рассмотрим многомерную стохастическую систему
dxt = (A(t) xt + B1 (t )vt + B2 (t )ut )dt + (A0 (t) xt + B10 (t )vt + B20 (t)ut )dwt,
zt = C(t)xt + D(t)ut, x0 = a, t e [0, T], T < ж, (1)
где xt - вектор состояния, vt - внешнее возмущение, ut - управляющий сигнал, zt -управляемый выход. Винеровский случайный процесс (wt ), не теряя в общности, считаем скалярным. Вектор x0 не случайный. Процесс v = ( vt ), детерминированный или случайный неупреждающий, предполагается имеющим конечную энер-
fT 2
гию E I | vt | dt <ж. Говоря формально, v есть элемент гильбертова пространства
J 0
LF([0,T], L2(Q,Rl)), где Q - пространство элементарных событий, F- поток ст-алгебр Ft. Норму процесса v определяем как|| v ||= (E|0 | vt |2 dt)1/2. Энергия
|| и ||2 процесса и = (ut) также предполагается конечной, тогда существует единственное решение xt = x(t,и,v,x0) уравнения (1) с конечной энергией [1] . Ясно, что в этом случае энергия процесса z тоже конечна. Считаем также выполненными условия DC = 0, DD = I, названные в [2] условиями регулярности, они не слишком ограничительны. Заметим, что в ряде работ управляемый выход определяется как сумма z=C x+D и, тогда
z'z = x C C x + и'D'D и + x' C'D и + и'D' Cx .
В других работах полагают z = (^), и тогда
z' z = x' C' C x + и' D' D и.
1 Работа выполнена при финансовой поддержке РФФИ (грант № 13-08-00744).
Условие C’D = 0 снимает различие этих двух определений. Условие же D'D = I вообще ограничением не является, если D - неособенная матрица.
Пусть L : v ^ z - оператор передачи внешнего возмущения на управляемый выход. Предположим, что существует число у > 0 , такое, что ||z|| < у ||v||. Нормы
||v||, ||z|| индуцируют норму ||L|| оператора L по формуле ||L|| = sup (|| z || /1| v ||).
уф 0,x0 = 0
Норма ||L|| < у является мерой максимально негативного (наименее благоприятного) влияния, которое при заданном y может иметь возмущение v на управляемый выход z. Пусть супремум по v Ф 0, x0 = 0 достигается на элементе v* e L2f ([0,T], L2(Q,Rl)), тогда можно показать [2], что v* минимизирует функционал
J1(v) = EJT (y 2vt'vt - z't zt)dt. ()
Тем самым трудная задача вычисления нормы ||L|| < y сводится к традиционной задаче минимизации функционала.
1. Постановка задачи
Сформулируем стохастические задачи Яж-управления и Я2/Яж-управления для системы (1). Задача Яж-управления состоит в следующем [3]: 1) Для заданного вещественного числа y > 0 найти такое управление
и* e L2f ([0,T], L2(Q,Rm)),
что || L ||< y, где L(v)=C x( . , и, v, 0) + D и; при этом 2) управление и* стабилизирует замкнутую систему, например, в следующем смысле:
limE | x(t,и*,0,x0) |2 = 0.
t
Постановка задачи Я2/Яж-управления включает те же требования 1), 2) и дополнительное требование: 3) если в уравнении (1) положить v = v*, то и = и* минимизирует функционал энергии || z ||2:
J2(u) = EI (x'tC'Cx't + u'ut)dt. (3)
0
Управление и, удовлетворяющее требованиям 1) -3), обозначаем через и*. Оно решает Я2/Яж-задачу. В следующих двух разделах перейдем к решению задач Яж и Я2/Яж для системы (1), внутренние шумы которой представлены суммой случайных процессов, мультипликативных - один по состоянию, другой по управлению. Случайную составляющую B10 vtdwt, мультипликативную по внешнему возмущению v, считаем отсутствующей (B10 = 0). Задача Я2/Яж-управления для системы с внутренним шумом, мультипликативным по состоянию, упомянута (по-видимому, впервые) в работе [3] как теоретически интересная и практически значимая. Аналогичная задача для системы (1) с коэффициентами А0 Ф 0, B10 Ф 0 , но с B20 = 0 решена в работе [2].
2. Задача подавления внешнего возмущения
Замкнем систему (1) (считаяB10 = 0) обратной связью ut(x) = K2(t)xt с переменным во времени коэффициентом передачи K2 (t), пока не определенным. Получим замкнутую систему (нижний индекс «с» - от английского closed (замкнутый)) dxc(t) = (Ac(t) xc(t) + B1(t) vt)dt + A0c(t) xc(t) dwt,
zc(t) = Cc(t) xc(t), xc(0) = a, t e [0,7^, (4)
где xc (t) - вектор состояния замкнутой системы и приняты обозначения Ac (t) = A(t) + B2 (t) K2 (t), Aqc (t) = Aq (t) + B2q (t) K2 (t),
Cc (t) = C(t) + D(t) K2 (t). (5)
Сначала, задавшись числом y > 0 , рассмотрим Яж-задачу гашения внешнего возмущения. Формально считая vt управлением, задачу гашения будем интерпретировать как задачу минимизации по vt функционала
J (v) = E|0T (y2vt vt - zc (t)zc (t))dt. (6)
Необходимое и достаточное условие существования решения Яж-задачи дается фундаментальной леммой об ограниченности нормы оператора Lc : v ^ zc для
стохастической системы (4). Сформулируем здесь эту лемму [3].
Лемма об ограниченности. Для стохастической системы (4) и для заданного Y > 0 условие || L ||< y выполняется тогда и только тогда, когда дифференциальное уравнение Риккати
P + Ac P + PAc + AQc PAqc - y-2PB1B1 - Cc Cc = 0, P(T) = 0 (7)
имеет единственное решение P(t) < 0 на [0, T]. Наименее благоприятное возмущение v* дается формулой
v**( x) = -Y-2 B1(t) P(t) x.
В подробной записи уравнение (7) представляется в виде (см. (5))
P + (A + B2 K2 ) ' P1 + P1 (A + B2 K2) - (Aq + B20 K2)' P (Aq + B20 K2 ) - (8)
О (8)
-Y-2P1B1 B'P1 - K2K2 - C C = 0, P(T) = 0.
Значение матрицы K2 все еще не определено (оно будет определено ниже формулой (10)).
3. Оптимизация системы при наихудшем внешнем возмущении
*
Подставив в (5) v = v , получим систему
dxt = ((A(t) - y-2 B1 (t) B1 (t) P1 (t)) xt + B2 (t )ut )dt + ( Aq (t) xt + B2Q (t )u )dwt,
zt = C(t)xt + D(t)ut, xQ = a, t e [0,T]. (9)
Минимизируя функционал J2(u) в формуле (3) при ограничении (9), получим оптимальное управление и* при наименее благоприятном возмущении v*. При B2Q(t) = 0 решение этой оптимизационной задачи представлено в [3]. В нашем
*
случае, когда B2Q(t) Ф 0 , решение и также известно [4]. Оно получено с использованием теории FBSDE-решений систем прямого (forward) и обратного (backward) стохастических дифференциальных уравнений [5] и имеет вид
u*(t) = K2(t) xt = -(B2 P2 + B2q M) xt, (10)
где P2(t) > 0, t e [0, T] - единственное решение следующей дифференциальной системы:
P + (A-y-2B1B1'P1)'P2 + P2(A-y-2 BB'P) + aqm - P2 B2 B'2QM -
-P2 B2B2 P2 + c 'c = 0, P2 (t) = 0, m = P2 Aq - P2B2Q B2P2 - P2 B2Q b2qm. (11)
Система (11) включает дифференциальное уравнение типа Риккати и алгебраическое уравнение связи матриц P2 и M .
Полученную в работе систему уравнений (8), (11) можно считать обобщением результата работы [3]. В самом деле, при B2Q = 0 (когда нет шума, зависящего от
* /
управления) имеем M = P2Aq , см. (11), и, следовательно, ut (x) = -B2P2x, где P2 > 0 - решение (существующее по доказанному в [6]) уравнения Риккати
P2 + (A-y-2BB'P1)'P2 + Pi(A-Y-2B1B1P1) + AQP2Aq -P2B2B2P2 + CC = 0,
P2(t) = 0. (12)
Система уравнений (11), (12) совпадает с аналогичной системой уравнений (43), (45), полученной впервые в [3].
Подставив в (8) значение K2 =-B’2P2 + B’2QM из (10), получим запись уравнения (8) в следующем виде:
P1 + (А - B2B2 P2 - B2B2oM) 'P1 + P(А - B2 B2P2 - B2 B2oM) --(А0 - B20 B2P2 - B20B20M) P1 (A0 - B20 B2P2 - B20 B20M) -
-Y-2P1B1B1'P1 - K2K2 - C C = 0, P1(T) = 0. (13)
Решая систему уравнений (11), (13), получим затем искомые функции v* (x), и*(x).
Заключение
В работе получено решение задачи стохастического робастного Я2/Яж-управ-ления для случая, когда диффузионная компонента стохастического дифференциального уравнения, описывающего систему управления, содержит внутренние шумы системы, мультипликативные по состоянию и по управлению. Задача свелась к нахождению решения системы двух связанных дифференциальных уравнений (11), (13) относительно матричных переменных P (t) < 0, P2 (t) > 0.
ЛИТЕРАТУРА
1. Булинский А.В., Ширяев А.Н. Теория случайных процессов. М.: Физматлит, 2003. 399 c.
2. Ятп^еп D., Pritchard A.J. Stochastic Яж // SIAM J. Control Optim. 1998. V. 36. No 5. P. 1504-1538.
3. Chen B.S. and Zhang W. Stochastic Я^Яи-control with state-dependent noise // IEEE Trans. Automat. Control. 2004. V. 49. No. 1. P. 45-56.
4. Wu Zhen. Forward-backward stochastic differential equations, linear quadratic stochastic optimal control and nonzero sum differential games // J. Systems Science and Complexity. 2005. V.18. No. 2. P. 179-192.
5. Ma Jin, Protter Philip, Yong Jiongmin. Solving Forward-Backward Stochastic Differential Equations Explicitly - A Four Step Scheme. Probability Theory and Related Fields. 1994. V. 98. P. 339-359.
6. Bensoussan A. Lecture Notes in Mathematics. Springer Verlag, 1983. V. 972. P. 3-39.
Шайкин Михаил Ермолаевич Институт проблем управления им. В. А. Трапезникова РАН, Москва
E-mail: [email protected] Поступила в редакцию 5 мая 2012 г.
Shaikin Michail E. (Institute of Control Sciences, RAS, Moscow). Extension of one known result in stochastic H/Ho-control theory.
Keywords: state and control dependent noise, disturbance attenuation problem, robust control, Riccati-type equation.
The paper discusses the stochastic linear Я2/Яж-control problem with state and control dependent noise. The solution of stochastic Яг/Яи-control problem with finite horizon has close relation to a pair of coupled Riccati-type equations.