Научная статья на тему 'Обобщение одного результата в статистической теории h 2/h ∞ управления'

Обобщение одного результата в статистической теории h 2/h ∞ управления Текст научной статьи по специальности «Математика»

CC BY
102
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ШУМ / ЗАВИСЯЩИЙ ОТ СОСТОЯНИЯ И УПРАВЛЕНИЯ / ПОДАВЛЕНИЕ ВОЗМУЩЕНИЙ / РОБАСТНОЕ УПРАВЛЕНИЕ / МАТРИЧНОЕ РИККАТИ-ПОДОБНОЕ УРАВНЕНИЕ / STATE AND CONTROL DEPENDENT NOISE / DISTURBANCE ATTENUATION PROBLEM / ROBUST CONTROL / RICCATI-TYPE EQUATION

Аннотация научной статьи по математике, автор научной работы — Шайкин Михаил Ермолаевич

Получено решение задачи стохастического робастного H 2/H ∞ -управления динамической системой с внутренними шумами, мультипликативными по состоянию и управлению, на конечном интервале времени. Задача сводится к нахождению решения системы двух связанных матричных дифференциальных Риккати-подобных уравнений относительно матричных переменных P 1(t)≤0, P 2(t)≥0.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Extension of one known result in stochastic H 2/H ∞ -control theory

The paper discusses the stochastic linear H 2/H ∞-control problem with state and control dependent noise. The solution of stochastic H 2/H ∞-control problem with finite horizon has close relation to a pair of coupled Riccati-type equations.

Текст научной работы на тему «Обобщение одного результата в статистической теории h 2/h ∞ управления»

2013

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА Управление, вычислительная техника и информатика

№ 2(23)

УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ

УДК 519.25

М.Е. Шайкин

ОБОБЩЕНИЕ ОДНОГО РЕЗУЛЬТАТА В СТАТИСТИЧЕСКОЙ ТЕОРИИ Я2/ЯМ-УПРАВЛЕНИЯ1

Получено решение задачи стохастического робастного Я2/Яж-управления динамической системой с внутренними шумами, мультипликативными по состоянию и управлению, на конечном интервале времени. Задача сводится к нахождению решения системы двух связанных матричных дифференциальных Риккати-подобных уравнений относительно матричных переменных Pi(t) < 0, P2(t) > 0.

Ключевые слова: шум, зависящий от состояния и управления, подавление возмущений, робастное управление, матричное Риккати-подобное уравнение.

Рассмотрим многомерную стохастическую систему

dxt = (A(t) xt + B1 (t )vt + B2 (t )ut )dt + (A0 (t) xt + B10 (t )vt + B20 (t)ut )dwt,

zt = C(t)xt + D(t)ut, x0 = a, t e [0, T], T < ж, (1)

где xt - вектор состояния, vt - внешнее возмущение, ut - управляющий сигнал, zt -управляемый выход. Винеровский случайный процесс (wt ), не теряя в общности, считаем скалярным. Вектор x0 не случайный. Процесс v = ( vt ), детерминированный или случайный неупреждающий, предполагается имеющим конечную энер-

fT 2

гию E I | vt | dt <ж. Говоря формально, v есть элемент гильбертова пространства

J 0

LF([0,T], L2(Q,Rl)), где Q - пространство элементарных событий, F- поток ст-алгебр Ft. Норму процесса v определяем как|| v ||= (E|0 | vt |2 dt)1/2. Энергия

|| и ||2 процесса и = (ut) также предполагается конечной, тогда существует единственное решение xt = x(t,и,v,x0) уравнения (1) с конечной энергией [1] . Ясно, что в этом случае энергия процесса z тоже конечна. Считаем также выполненными условия DC = 0, DD = I, названные в [2] условиями регулярности, они не слишком ограничительны. Заметим, что в ряде работ управляемый выход определяется как сумма z=C x+D и, тогда

z'z = x C C x + и'D'D и + x' C'D и + и'D' Cx .

В других работах полагают z = (^), и тогда

z' z = x' C' C x + и' D' D и.

1 Работа выполнена при финансовой поддержке РФФИ (грант № 13-08-00744).

Условие C’D = 0 снимает различие этих двух определений. Условие же D'D = I вообще ограничением не является, если D - неособенная матрица.

Пусть L : v ^ z - оператор передачи внешнего возмущения на управляемый выход. Предположим, что существует число у > 0 , такое, что ||z|| < у ||v||. Нормы

||v||, ||z|| индуцируют норму ||L|| оператора L по формуле ||L|| = sup (|| z || /1| v ||).

уф 0,x0 = 0

Норма ||L|| < у является мерой максимально негативного (наименее благоприятного) влияния, которое при заданном y может иметь возмущение v на управляемый выход z. Пусть супремум по v Ф 0, x0 = 0 достигается на элементе v* e L2f ([0,T], L2(Q,Rl)), тогда можно показать [2], что v* минимизирует функционал

J1(v) = EJT (y 2vt'vt - z't zt)dt. ()

Тем самым трудная задача вычисления нормы ||L|| < y сводится к традиционной задаче минимизации функционала.

1. Постановка задачи

Сформулируем стохастические задачи Яж-управления и Я2/Яж-управления для системы (1). Задача Яж-управления состоит в следующем [3]: 1) Для заданного вещественного числа y > 0 найти такое управление

и* e L2f ([0,T], L2(Q,Rm)),

что || L ||< y, где L(v)=C x( . , и, v, 0) + D и; при этом 2) управление и* стабилизирует замкнутую систему, например, в следующем смысле:

limE | x(t,и*,0,x0) |2 = 0.

t

Постановка задачи Я2/Яж-управления включает те же требования 1), 2) и дополнительное требование: 3) если в уравнении (1) положить v = v*, то и = и* минимизирует функционал энергии || z ||2:

J2(u) = EI (x'tC'Cx't + u'ut)dt. (3)

0

Управление и, удовлетворяющее требованиям 1) -3), обозначаем через и*. Оно решает Я2/Яж-задачу. В следующих двух разделах перейдем к решению задач Яж и Я2/Яж для системы (1), внутренние шумы которой представлены суммой случайных процессов, мультипликативных - один по состоянию, другой по управлению. Случайную составляющую B10 vtdwt, мультипликативную по внешнему возмущению v, считаем отсутствующей (B10 = 0). Задача Я2/Яж-управления для системы с внутренним шумом, мультипликативным по состоянию, упомянута (по-видимому, впервые) в работе [3] как теоретически интересная и практически значимая. Аналогичная задача для системы (1) с коэффициентами А0 Ф 0, B10 Ф 0 , но с B20 = 0 решена в работе [2].

2. Задача подавления внешнего возмущения

Замкнем систему (1) (считаяB10 = 0) обратной связью ut(x) = K2(t)xt с переменным во времени коэффициентом передачи K2 (t), пока не определенным. Получим замкнутую систему (нижний индекс «с» - от английского closed (замкнутый)) dxc(t) = (Ac(t) xc(t) + B1(t) vt)dt + A0c(t) xc(t) dwt,

zc(t) = Cc(t) xc(t), xc(0) = a, t e [0,7^, (4)

где xc (t) - вектор состояния замкнутой системы и приняты обозначения Ac (t) = A(t) + B2 (t) K2 (t), Aqc (t) = Aq (t) + B2q (t) K2 (t),

Cc (t) = C(t) + D(t) K2 (t). (5)

Сначала, задавшись числом y > 0 , рассмотрим Яж-задачу гашения внешнего возмущения. Формально считая vt управлением, задачу гашения будем интерпретировать как задачу минимизации по vt функционала

J (v) = E|0T (y2vt vt - zc (t)zc (t))dt. (6)

Необходимое и достаточное условие существования решения Яж-задачи дается фундаментальной леммой об ограниченности нормы оператора Lc : v ^ zc для

стохастической системы (4). Сформулируем здесь эту лемму [3].

Лемма об ограниченности. Для стохастической системы (4) и для заданного Y > 0 условие || L ||< y выполняется тогда и только тогда, когда дифференциальное уравнение Риккати

P + Ac P + PAc + AQc PAqc - y-2PB1B1 - Cc Cc = 0, P(T) = 0 (7)

имеет единственное решение P(t) < 0 на [0, T]. Наименее благоприятное возмущение v* дается формулой

v**( x) = -Y-2 B1(t) P(t) x.

В подробной записи уравнение (7) представляется в виде (см. (5))

P + (A + B2 K2 ) ' P1 + P1 (A + B2 K2) - (Aq + B20 K2)' P (Aq + B20 K2 ) - (8)

О (8)

-Y-2P1B1 B'P1 - K2K2 - C C = 0, P(T) = 0.

Значение матрицы K2 все еще не определено (оно будет определено ниже формулой (10)).

3. Оптимизация системы при наихудшем внешнем возмущении

*

Подставив в (5) v = v , получим систему

dxt = ((A(t) - y-2 B1 (t) B1 (t) P1 (t)) xt + B2 (t )ut )dt + ( Aq (t) xt + B2Q (t )u )dwt,

zt = C(t)xt + D(t)ut, xQ = a, t e [0,T]. (9)

Минимизируя функционал J2(u) в формуле (3) при ограничении (9), получим оптимальное управление и* при наименее благоприятном возмущении v*. При B2Q(t) = 0 решение этой оптимизационной задачи представлено в [3]. В нашем

*

случае, когда B2Q(t) Ф 0 , решение и также известно [4]. Оно получено с использованием теории FBSDE-решений систем прямого (forward) и обратного (backward) стохастических дифференциальных уравнений [5] и имеет вид

u*(t) = K2(t) xt = -(B2 P2 + B2q M) xt, (10)

где P2(t) > 0, t e [0, T] - единственное решение следующей дифференциальной системы:

P + (A-y-2B1B1'P1)'P2 + P2(A-y-2 BB'P) + aqm - P2 B2 B'2QM -

-P2 B2B2 P2 + c 'c = 0, P2 (t) = 0, m = P2 Aq - P2B2Q B2P2 - P2 B2Q b2qm. (11)

Система (11) включает дифференциальное уравнение типа Риккати и алгебраическое уравнение связи матриц P2 и M .

Полученную в работе систему уравнений (8), (11) можно считать обобщением результата работы [3]. В самом деле, при B2Q = 0 (когда нет шума, зависящего от

* /

управления) имеем M = P2Aq , см. (11), и, следовательно, ut (x) = -B2P2x, где P2 > 0 - решение (существующее по доказанному в [6]) уравнения Риккати

P2 + (A-y-2BB'P1)'P2 + Pi(A-Y-2B1B1P1) + AQP2Aq -P2B2B2P2 + CC = 0,

P2(t) = 0. (12)

Система уравнений (11), (12) совпадает с аналогичной системой уравнений (43), (45), полученной впервые в [3].

Подставив в (8) значение K2 =-B’2P2 + B’2QM из (10), получим запись уравнения (8) в следующем виде:

P1 + (А - B2B2 P2 - B2B2oM) 'P1 + P(А - B2 B2P2 - B2 B2oM) --(А0 - B20 B2P2 - B20B20M) P1 (A0 - B20 B2P2 - B20 B20M) -

-Y-2P1B1B1'P1 - K2K2 - C C = 0, P1(T) = 0. (13)

Решая систему уравнений (11), (13), получим затем искомые функции v* (x), и*(x).

Заключение

В работе получено решение задачи стохастического робастного Я2/Яж-управ-ления для случая, когда диффузионная компонента стохастического дифференциального уравнения, описывающего систему управления, содержит внутренние шумы системы, мультипликативные по состоянию и по управлению. Задача свелась к нахождению решения системы двух связанных дифференциальных уравнений (11), (13) относительно матричных переменных P (t) < 0, P2 (t) > 0.

ЛИТЕРАТУРА

1. Булинский А.В., Ширяев А.Н. Теория случайных процессов. М.: Физматлит, 2003. 399 c.

2. Ятп^еп D., Pritchard A.J. Stochastic Яж // SIAM J. Control Optim. 1998. V. 36. No 5. P. 1504-1538.

3. Chen B.S. and Zhang W. Stochastic Я^Яи-control with state-dependent noise // IEEE Trans. Automat. Control. 2004. V. 49. No. 1. P. 45-56.

4. Wu Zhen. Forward-backward stochastic differential equations, linear quadratic stochastic optimal control and nonzero sum differential games // J. Systems Science and Complexity. 2005. V.18. No. 2. P. 179-192.

5. Ma Jin, Protter Philip, Yong Jiongmin. Solving Forward-Backward Stochastic Differential Equations Explicitly - A Four Step Scheme. Probability Theory and Related Fields. 1994. V. 98. P. 339-359.

6. Bensoussan A. Lecture Notes in Mathematics. Springer Verlag, 1983. V. 972. P. 3-39.

Шайкин Михаил Ермолаевич Институт проблем управления им. В. А. Трапезникова РАН, Москва

E-mail: [email protected] Поступила в редакцию 5 мая 2012 г.

Shaikin Michail E. (Institute of Control Sciences, RAS, Moscow). Extension of one known result in stochastic H/Ho-control theory.

Keywords: state and control dependent noise, disturbance attenuation problem, robust control, Riccati-type equation.

The paper discusses the stochastic linear Я2/Яж-control problem with state and control dependent noise. The solution of stochastic Яг/Яи-control problem with finite horizon has close relation to a pair of coupled Riccati-type equations.

i Надоели баннеры? Вы всегда можете отключить рекламу.