Научная статья на тему 'Управление с прогнозирующей моделью системами с марковскими скачками по критерию «Mean-variance» при ограничениях'

Управление с прогнозирующей моделью системами с марковскими скачками по критерию «Mean-variance» при ограничениях Текст научной статьи по специальности «Математика»

CC BY
207
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УПРАВЛЕНИЕ С ПРОГНОЗИРУЮЩЕЙ МОДЕЛЬЮ / «MEAN-VARIANCE»-КРИТЕРИЙ / МАРКОВСКИЕ СКАЧКИ / ОГРАНИЧЕНИЯ / «MEAN-VARIANCE» CRITERION / MODEL PREDICTIVE CONTROL / MARKOVIAN JUMPS / CONSTRAINS

Аннотация научной статьи по математике, автор научной работы — Домбровский Владимир Валентинович, Объедко Татьяна Юрьевна

Рассматривается задача управления с прогнозирующей моделью по критерию «mean-variance» для дискретных систем с мультипликативными шумами и скачкообразно меняющимися параметрами. Параметры уравнений меняются в соответствии с эволюцией однородной марковской цепи с конечным пространством состояний и известной матрицей переходных вероятностей. Определена стратегия управления с учетом явных ограничений на управляющие переменные.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Домбровский Владимир Валентинович, Объедко Татьяна Юрьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Mean-variance MPC for linear systems with Markovian jumps under constraints

We consider the following Markov jump linear system with multiplicative noise B 0[a(k +1), k +1] + £ Bj [a(k +1), k + 1]w j (k +1) _ j=1 where x(k) is the n x dimensional vector of state, u(k) is the n u dimensional vector of control; a(k), k = 0,1,2., denotes a time-invariant Markov chain taking values in a finite set of observable states {1,2,..,v} with transition probability matrix P = [Pj], i, j e {1,2,..., v}, Pj= P {a(k +1) = aj |a(k) = a,}, }= 1, j=1 V and initial distribution p t = P{a(0) = i}, i = 1,2,...,v; £p t = 1; ro j(k) are independent zero-mean i=1 random variables with unit variance and independent of the Markov chain a(k), k = 0,1,2.; A, B,[a(k),k], j = 1,.,n, the matrixes of corresponding dimensions, Bj[a(k),k] e {B/'1}, j = 0,.,n, i = 1,.,v. Let y(k) = L(k)x(k) be the scalar output of the system (1), where L(k) is the vector of corresponding dimension. The following constraints are imposed on control actions u mn(k) 1 (k,i)M {(y(k + i) M {y(k + i) / x(k), a(k)} ) 2 / x(k), a(k)} -i=1 -p 2(k, i)M {y(k + i)/x(k), a(k)} + M {u T (k + i -1/k) R(k, i 1)u(k + i -1/k)/x(k), a(k)}, on trajectories of system (1) over the sequence of predictive controls u(k/k),..., u(k+m-1/k), which depend on system's state at moment k, under constraints (2), R(k,i')>0 is the weigh matrix of corresponding dimension, p!(k,i)>0, p 2(k,i) >0 are weigh coefficients, m is the prediction horizon, k is the current moment. The synthesis of predictive control strategies is reduced to the solving of a sequence of quadratic programming tasks.

Текст научной работы на тему «Управление с прогнозирующей моделью системами с марковскими скачками по критерию «Mean-variance» при ограничениях»

2012

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА Управление, вычислительная техника и информатика

№ 4(21)

УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ

УДК 519.865.5

В.В. Домбровский, Т.Ю. Объедко

УПРАВЛЕНИЕ С ПРОГНОЗИРУЮЩЕЙ МОДЕЛЬЮ СИСТЕМАМИ С МАРКОВСКИМИ СКАЧКАМИ ПО КРИТЕРИЮ «MEAN-VARIANCE» ПРИ ОГРАНИЧЕНИЯХ

Рассматривается задача управления с прогнозирующей моделью по критерию «mean-variance» для дискретных систем с мультипликативными шумами и скачкообразно меняющимися параметрами. Параметры уравнений меняются в соответствии с эволюцией однородной марковской цепи с конечным пространством состояний и известной матрицей переходных вероятностей. Определена стратегия управления с учетом явных ограничений на управляющие переменные.

Ключевые слова: управление с прогнозирующей моделью, «mean-variance»-критерий, марковские скачки, ограничения.

Моделями с марковскими скачкообразными параметрами описывается широкий класс реальных систем [1]. В этих моделях предполагается, что смена структуры системы осуществляется в соответствии с эволюцией наблюдаемой или скрытой марковской цепи с конечным пространством состояний.

Решению различных задач управления и оценивания для таких систем посвящено значительное количество работ [2-12].

В работах нобелевского лауреата по экономике Г. Марковица [13] при решении однопериодной (статической) задачи оптимизации инвестиционного портфеля (ИП) был предложен критерий «mean-variance» («среднее - вариация»). Этот критерий представляет собой соотношение (trade-off) между вариацией и математическим ожиданием выхода системы. В динамической постановке задача управления по критерию «mean - variance» в непрерывном и дискретном времени на примере оптимизации ИП рассматривалась в [14-16]. С учетом марковских скачков параметров уравнений данная задача решена в работах [11, 12]. В этих работах задача минимизации критерия решается в конечной точке горизонта управления. При этом не контролируются значения вариации и математического ожидания выхода системы в промежуточных точках траектории. В работах [6, 7] сформулирована и решена задача управления системами с марковскими скачками и мультипликативными шумами на конечном горизонте с учетом значений дисперсии и математического ожидания выхода вдоль всей траектории управления. В упомянутых выше работах [6, 7,

11, 12, 14-16] не учитываются ограничения на переменные управления. Однако во многих практических задачах, в том числе при оптимизации ИП, необходимо учитывать жесткие ограничения на управляющие воздействия.

Эффективным подходом к синтезу систем управления с ограничениями, получившим широкое признание и применение в практике управления сложными тех-

нологическими процессами, является метод управления с прогнозирующей моделью (управление со скользящим горизонтом) [17]. Применению данного метода к управлению дискретными системами с марковскими скачками посвящены работы [3, 5]. В [5] предлагается метод синтеза стратегий управления при «мягких» вероятностных ограничениях. В работе [3] рассматривается задача управления по квадратичному критерию при «жестких» ограничениях на управляющие переменные.

В настоящей работе рассматривается задача синтеза стратегий управления с прогнозированием для систем с марковскими скачками и мультипликативными шумами по критерию «шеап-уапапсе». Получены уравнения синтеза оптимальных стратегий управления с учетом «жестких» ограничений на управляющие переменные.

1. Постановка задачи

Пусть объект управления описывается уравнением

х(к +1) = Лх(к) +

Б0[а(к +1), к +1] + £ Б} [а(к +1), к +1] (к +1)

і=1

и (к), (1)

где х(к) - пх-мерный вектор состояния, и(к) - «„-мерный вектор управления, .), 3 = 1,2,...,п, - независимые между собой дискретные белые шумы с нулевым средним и единичной дисперсией, а(к), к = 0,1,2______, - однородная дискретная марков-

ская цепь с конечным множеством состояний {1,2,_,у}, известной матрицей переходных вероятностей

Р = [Р.], г,3 е {1,2,...,V}, Р},= Р{(к у1) = а. |а(к) = а}, £} = 1,

3=1

и известным начальным распределением

р, = Р{а(о) = г}, г = 1,2,...,V; £р, = 1.

г=1

Предполагается, что состояние марковской цепи а(к) в момент времени к доступно наблюдению. Последовательности м3(к) и а(к) независимы. А, В3[а(к),к], 3 = 0,_,п, - матрицы соответствующих размерностей.

Пусть скалярный выход системы (1)

у(к) = Ь(к) х(к), (2)

где Ь(к) - вектор-строка соответствующей размерности.

На управляющие воздействия накладываются ограничения

мт1П (к) < £(к)и (к) < итах (к), (3)

где £(к) - матрица соответствующей размерности.

Для управления системой (1) при ограничениях (3) синтезируем стратегии с прогнозирующей моделью по следующему правилу. На каждом шаге к минимизируем «теап-уапапсе»-критерий со скользящим горизонтом управления:

т

3(к + т/к) = £р1 (к,г)М{(у(к + г)-М{у(к + г)/х(к),а(к)}2 /х(к),а(к)} -

г =1

-р2 (к, г)М {у(к + г) / х(к), а( к)} +

+М {иТ (к + г -1/ к)Я (к, г - 1)и (к + г -1/ к)/ х(к), а(к)}, (4)

на траекториях системы (1) по последовательности прогнозирующих управлений и(к/к),... ,и(к+т-1/к), зависящих от состояния системы в момент времени к, при ограничениях (3), р1 (к,/) > 0, р2(к,/) > 0 - весовые коэффициенты, Я(к,/) > 0 - весовая матрица соответствующей размерности, т - горизонт прогноза, к - текущий момент времени. В качестве управления в момент времени к берем и(к) = и(к/к). Чтобы получить управление и(к+1) на следующем шаге, процедура повторяется для следующего момента к+1 и т.д.

Весовые коэффициенты р1(к,/)>0, р2(к,/)>0 можно рассматривать как коэффициенты склонности к риску, задающие соотношение между ожидаемым выходом системы и соответствующим риском (вариацией) в момент времени к.

Замечание 1. В критерии (4) присутствуют слагаемые, содержащие квадратичные формы от управлений. В общем случае наличие этих слагаемых гарантирует существование решения задачи управления.

2. Синтез стратегий управления с прогнозированием

Цепь Маркова с дискретным временем допускает следующее представление в пространстве состояний [9]:

0(к +1) = Р0(к) + и(к +1), (5)

где 0(к) = [5(а(к),1),...,5(а(к);у)]т, 5(а(ку) - функция Кронекера,] = 1,2,...^; и(к) -мартингал разность с характеристиками

М {(к +1)/ 0(к )} = 0; (6)

С (к +1) = М{ и(к + 1)ит (к +1)/0(к)} = Шая{Р0(к)} - Р Шая{0(к)}Рг. (7)

С учетом (5) систему (1) можно представить в следующем виде:

х(к +1) = Лх(к) +

В0 [0(к +1), к +1] + £ Б} [0(к +1), к +1]^; (к +1)

и(к), (8)

і=1

где В і [0( к), к ] = £ 0г (к) В і«(к), (і = М). (9)

2=1

Здесь 0,(к), і = 1,2, ...,у, - компоненты вектора 0(к), {В/1-1},і = 0,...,п, і = 1,...,у, -множество значений матрицы ВД0(к),к].

Критерий (4) будет иметь вид

т

,/ (к+т / к)=£р](к ,і)М {((к+і) -М {(к+і)/х(к ),0(к )}2/ х(к ),0(к)}- (10)

і=1

-р2(к ,і) М {у(к+і)/х(к ),0(к)}+ М {ыТ (к+і-1/к) у к ,і-1)и(к+і-1/к)/х(к ),0(к)},

Теорема. Вектор прогнозирующих управлений П(к) = [иТ(к/к),...,иТ(к+т-1/к)]Т, минимизирующий критерий (4) при ограничениях вида (3), на каждом шаге к определяется из решения задачи квадратичного программирования с критерием вида

У (к + т / к) = иТ (к)Н(к)П (к) - ^(к)П (к) (11)

при ограничениях

ит1П (к) < 5(к)и(к) < итах(к), (12)

где

S(k) = diag(S(k),..., S(k + m -1)),

Umin (k ) = [«L(k ),..., <m(k + m - 1)]T,

Umax (k) = [«Lax (kX- Umax (k + m - 1)]Т :

H(k), F(k) - блочные матрицы вида

■ H„(k) H12(k) ••• Hlm (k )■

H (k) = H21 (k) H22 (k) ^ H2m (k)

_ Hmi(k ) Hm2(k ) - Hmm (k ).

F(k) =[F1(k) F2(k) ••• Fm (k)],

(13)

(14)

Ht (k ) = R(k, t -1) +

блоки которых равны

+£ £ ((к + /) )Т ) [«Над {Р У (к)} - Е «Над (0(к)} (Р )Т ] Етд 0, (т - /) Д(г) (к + 0 +

п V т

+££(В(‘г)(к + о) )Еч (Р0(к} ]й(т -¿)В(9)(к + /); (15)

q=1 r=1

j=1 q=1

Htf (k) = ¿X (50q) (k +1) ) ) [Pf-t diag {0(k)} -

q=1 r=1

-Pf diag{0(k)}(Pt ) 4 (Лг )f-ta(m - f )50r)(k + f ), f > t;

Hf (k) = Hj (k), t > f ;

ft

^ (k) = б2(ш -1)£ Ер0(k)50q) (k +1) ;

q=i

Q1 (t ) = Q1 (t -1) Л + LT (к + m -1 )pj (к, m -1 ) L(k + m -1 ),(t = 1, m) ;

Qj(0) = L (k + m)p1(k,m)L(k + m) ;

Q2 (t ) = Q2(t -1) Л + L( k + m -1 )p2 (k, m -1 ), (t = 1, m) ;

Q2(0) = L(k + m)p2(k, m);

Eq =[0,...,0,1,0,...,0], q = jV.

Оптимальное управление

u(k ) = [ °.. - V ] U (k >,

(16)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(17)

(18)

(19)

(20) (21) () (23)

где Іп - единичная матрица размерности пи, 0п - квадратная нулевая матрица размерности пи.

Замечание 2. Заметим, что условие Я(к,і)>0 гарантирует, что матрица Н(к) будет положительно определенная и, следовательно, решение задачи квадратичного программирования с критерием (4) существует и единственное.

Доказательство. Введем обозначение

3+, = М {[Р! (к,1)[у(к +1) -М{у(к +1)/х(к), 0(к)}]2 --р2 (к, 1)у(к +1) + иТ (к/ к)К (к, 0)и(к /к)^ / х(к), 0(к)} +

+М {[р1 (к, 2)[у(к + 2) - М{у(к + 2) / х(к), 0(к)}]2 --р2 (к, 2) у(к + 2) + иТ (к +1/ к) К (к, 1)и(к +1/ к) ^ / х(к), 0(к)} +... +

+М {[р1 (к, 5)[у(к + 5) -М{у(к + s)/ х(к), 0(к)}]2 -

-р2 (к, 5) у (к + 5) + иТ (к + 5 -1/ к) К (к, 5 - 1)и(к + 5 -1/ к) ^ / х(к), 0(к)}. Очевидно, что

Л+5+1 = М {[р1(к + 5 + 1)[у(к + 5 + 1) -М{у(к + 5 + 1)/ х(к), 0(к)}]2 --р2 (к, 5 +1) у(к + 5 +1) + иТ (к + 5 / к) К(к, 5 )и (к + 5 / к) ^ / х(к), 0(к)} + Зк+5 (24)

и 3 (к + т / к) = Зк+т. (25)

Рассмотрим

3+1 = М{[р1(к,1)[у(к +1) -М{у(к +1)/х(к),0(к)}]2 -

-р2 (к, 1)у(к +1) + иТ (к / к)К (к, 0)и (к / к) ^ / х(к), 0(к)}. (26)

Подставив в (26) вместо у(к+1) его выражение через х(к) из (2) и (8), вместо

0(к+1) его выражение через 0(к) из (5) и взяв условное математическое ожидание, будем иметь

3+1 = иТ (к/к)££ (50г)(к + 1))Т [£ЯС(к + 1)ЕГТ ]ЬТ (к + 1)р1 (к, 1) X

г=1 g=1

К V V

хЬ(к +1) 4 ) (к + 1)и (к / к) + иТ (к / к )£££ (В(г) (к + 1))Т Е^^ [ Р0(к )0Т (к) РТ +

5=1 Г=1 g =1

+С (к + 1)]£Т £ (к + 1)Р1 (к, 1) 1{ к +1) В ) (к +1) и( к / к) -

V

-р2 (к, 1) ¿(к +1) Ах(к) - р2 (к, 1) 1(к +1)£ [ ЕгР0(к )Щ(г) (к + 1)и (к / к) +

г=1

+иТ (к / к) К(к ,0)и(к / к), где С(к+1) = М{и(к+1)иТ(к+1)/0(к)}.

Предположим далее, что для некоторого q верно

Т

д V V

•4+ д = £ иТ (к + / -1/к)££(г)(к + /)) ) £ Р1-С (к +1 )(Рг-гУ /] X

/ =1 Г=1 g=1 I =1

д

£ (Лг-і )Т !Т (к + /)р1 (к, і)Цк + і)Лг-ів0£) (к + і)и (к + і -1/ к) +

І=і

Т

д п V V

£иТ (к + і -1/к){£££()(к + і)) Е^ [Р0(к)0Т (к)(Р )Т +

і=1 5=1 Г=1 £=1

1 Ы-1^/1г . 7\/пі-ІчТтттТ

+£Рг-гС(к + /)(РМ)Т ]ЕГТ х (27)

I=1

х£ (А-/ )Т ^ (к + г )р1 (к, г) ¿(к + г) А-/В5 ) (к + /) + К (к, / )}и (к + / -1/ к) +

г=/

д-1 _д _ | т _/_

+2£ £ иТ (к+/-1/к) ]££( )(к+/)) [ Eg £ рсс с (к+/)(Рг-у I ] х

/ =1 у=/+1 [ Г=1 g=1 I=1

х(АС-/ )Т £ (Аг-С )ТР (к + г)р1(к, г)Цк + г)Аг- ■7В(^)(к + у)! и (к + ] -1/к) -

г=У

" д

£р2 (к ,г) ¿(к+г )Аг-1 .г=1

Ах(к)-££р2(к,г)¿(к+г)Аг / £ЕГР/0(кВг)(к+/)и(к+/-1/к),

/=1 г=/ г=1

где С(к+1) = М{и(к+/)иТ(к+/)/0(к)}.

Покажем, что данная формула верна и для д+1. Действительно, из (24) следует,

что

•4+ д+1 = М {[р1(к, д +1)[ у (к + д +1) - М {у (к + д +1)/ х(к), 0(к )}]2 - (28)

-р2 (к, д +1) у(к + д +1) + иТ (к + д / к) К (к, д)и (к + д / к) ^ / х(к), 0(к)} + •+д.

Подставим в (28) вместо у(к+д+1) его рекуррентное выражение через х(к) из (8) и (2), вместо Зк+д его выражение из (27), взяв условное математическое ожидание и преобразовав выражение, получим

д+1 V V Т /

•к+д =£иТ (к + / -1/к)££()(к + /)) [Е^£Р/-1 С(к + /)(Р'-г)гЕТ]X

/ =1 Г=1 g=1 I=1

д+1

х£ (Аг-/ )Т ¿Т (к + г)р1 (к, г)Ь(к + г)Аг-/В,^) (к + /)и(к + / -1/к) +

г=/

д+1 | _у _у т _/

+£иТ (к+/-1/к)[ £££(Г) (к+/)) Еg [Р/0(к)0Т (к)(Р/ )Т +£р/-1С(к+1)(Р/-1 )Т ]ЕТ X

/=1 [^=1 Г=1 g=1 1=1

д+1 1

X £ (Аг-/ )Т £ (к + г )Р1 (к, г) ¿(к + г) А-/в( ) (к + /) + К(к, /) [■ и (к + / -1/ к) +

г=/ 1

д д+1 Г _у _у т _/_

+2£ £ иТ (к + / -1/к) |££(в0Г )(к + /)) [ Eg £ РС С (к + /)(Р-г)г ЕтТ Т

/ =1 С=/+1 [г=1 g=1 I=1

д+1 [

х(АС-/ )Т £ (Аг - С )ТР (к + г)р1(к, г)Ь(к + г)А-Св0g )(к + С) [ и (к + у -1/к) - (29)

г=у 1

■д+1

£р2 (к ,г) ¿(к+г )Аг-1 .г=1

д+1 д+1 V

Ах(к)-££р2 (к ,г) ¿(к+г) Аг-/ £ ЕГР' 0(к )В0Г) (к+/)и(к+/-1/к).

/=1 г=/ г=1

Формула (29) совпадает с (27), если в (27) д заменить на д+1, а значит, согласно принципу математической индукции, формула (27) верна для всех д = 1,2,.,т. Вводя рекуррентные соотношения (19) - (21), из (25) и (27) следует, что

т V V т

• (к + т / к) = £ иТ (к + / -1/к)££(г)(к + /)) х

/=1 г=1 g=1

/

х[ Eg £ Р/-1 С (к +1)(Р/-1 )ТЕТГ ]01(т - /) В0g) (к + /)и (к + / -1/ к) +

I=1

+£«+ (k + i - 1/k) jXXX (()(k + i)) ) [P0(k)0+ (k)(P )+ +

І=1 [ 5=1 Г=1 g=1

+£ Pi-IC(k + l)(Pi-I)+ ]E++ Q (m - i)Bg) (k + i) + R(k, i) Iu(k + І -1/k) +

I=1 m-1 m

+2X £ «+ (k + i-1/k)]SS(B0r)(k + i)) [)g£P;-C(k + I)(Pi-,)rI

i =1 j=i+1 [ Г=1 g=1 I=1

х(АС /) й(т - c)B0g)(к + С)| и (к + у -1/к) - 02(т - 1)Ах(к) -

т V

-£ 02(т -/)£ЕгР'0(кВ)(к + /)и(к + / -1/к). (30)

/=1 г=1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из определения 0(к) следует, что

0(к + г )0Т (к + г) = diag{0(k + г)}. (31)

Для вычисления матрицы С(к+г) = М{и(к+г)иТ(к+г)/0(к)}, используя уравнения (6), (7) и (31), нетрудно показать, что

С (к+г) = М {(к+г )иТ (к+г) / 0(к)} =

= diag{0(к)}- Рdiag{-10(к)} РТ, (г = 1т). (32)

Рассмотрим подробнее выражения, входящие в критерий (30). Используя (31), (32), получим

Рг 0(k)0T (к)(Рг )T + £ P1-lC(k + l)(PM )T = diag{P! 0(k)>; (33)

l=1

г

£[Рг-lC(k + l)(PM )T ] = diag{Pi0(к)>-Рг diag{0(k)>(Pi )T ; (34)

l=1

г

£[Pj-lC(k +1)(Рг-l)T ] = P}-г diag{Pi0(k)>- Pj diag{0(k)>(Рг )T. (35)

l =1

С учетом (33) - (35) выражение (30) примет вид

T

m v v

J(k + m/k) = £uT (k+г - 1/k)XE(()(k+г)) x

г=1 r=1 g=1

xEg [diag{P*0(k)>- Рг diag{0(k)>(Рг )T ]ETr Q1 (m -/)£0g) (k+t)u(k+1 -1/k) +

m Г n v t 1

+£uT (k+г -1/k)j ££(() (k+г)) Er diag{P*0(k) IETQ1 (m - 1)Б^) (k + г) +

m-1 m

+R(k,i)}u(k + i-1/k) + 2£ £ u+ (k+i -1/k) )(k+i))

i=1 C=i+1 [ Г=1 g=1

X Eg [ PC-i diag(P! 0(k)}-PC diag{0(k )|(P!)+ ]E+ (AJ->)+ Q (m - j )B0g) (k + j )}x

m v

xu (k + j -1/k) - ^(m -1) Ax(k) SQ2(m - i)£ E^ 0(k r)(k+i)«(k+i -1/k). (36)

i=1 Г=1

Выражение (36) можно записать в матричном виде:

J(k + m /k) = UT (k)H(k)U(k) - Q2(m -1)Ax(k) - F(k)U(k), (37)

где матрицы H(k), F(k) имеют вид (13) - (18). Таким образом, имеем задачу минимизации критерия (37) при ограничениях (3), которая эквивалентна задаче квадратичного программирования с критерием (11) при ограничениях (12). Теорема доказана.

Заключение

В данной работе предложен метод синтеза стратегий прогнозирующего управления по критерию «mean-variance» для дискретных систем с мультипликативными шумами и скачкообразно меняющимися параметрами. Данный подход позволяет в явном виде учесть ограничения на управления. Алгоритм синтеза прогнозирующей стратегии включает решение последовательности задач квадратичного программирования. Синтезированы стратегии управления с учетом явных ограничений на управляющие воздействия.

ЛИТЕРАТУРА

1. Пакшин П.В. Дискретные системы со случайными параметрами и структурой. М: Физ-матлит, 1994.

2. Пакшин П.В., Ретинский Д.М. Робастная стабилизация систем случайной структуры с переключаемой статической обратной связью по выходу // Автоматика и телемеханика. 2005. № 7. C. 135-147.

3. Домбровский В.В., Объедко Т.Ю. Управление с прогнозированием системами с марковскими скачками при ограничениях и применение к оптимизации инвестиционного портфеля // Автоматика и телемеханика. 2011. № 5. С. 96-112.

4. Смагин В.И., Поползухина Е.В. Синтез следящих систем управления для объектов со случайными скачкообразными параметрами и мультипликативными возмущениями // Вестник Томского государственного университета. 2000. № 271. С. 171-175.

5. Blackmore L., Bektassov A., Ono M., Williams B.C. Robust optimal predictive control of jump Markov linear systems using particles // Hybrid Systems: Comput. and Control /

A. Bemporad, A. Bicchi, G. Buttazzo, eds. New York: Springer-Verlag, 2007. V. 4416. Lecture Notes in Computer Science. P. 104-117.

6. Costa O.L.V., Oklmura R.T. Discrete-time mean-variance optimal control of linear systems with Markovian jumps and multiplicative noise // Intern. J. Control. 2009. V. 82. No. 2. P. 256-267.

7. Costa O.L.V., OUve^ra A. Optimal mean-variance control for discrete-time linear systems with Markovian jumps and multiplicative noises // Automatica. 2012. V. 48. No. 2. P. 304-315.

8. Dragan V., Morozan T. The linear quadratic optimization problems for a class of linear stochastic systems with multiplicative white noise and Markovian jumping // IEEE Transactions Automatic Control. 2004. V. 49. No. 5. P. 665-675.

9. ElUott R.J., Aggoun L., Moore J.B. Hidden Markov Models: Estimation and Control. Berlin: Springer-Verlag, 1995.

10. Li X., ZhouX.Y. Indefinite stochastic LQ control with Markovian jumps in a finite time horizon // Communications in Information and Systems. 2002. No. 2. P. 265-282.

11. Ym G., Zhou X.Y. Markowitz mean-variance portfolio selection with regime switching: from discrete-time models to their continuous-time limits // IEEE Transactions Automat. Control. March 2004. V. 39. No. 3. P. 349-360.

12. Zhou X.Y., Ym G. Markowitz’s mean-variance portfolio selection with regime-switching: a continuous-time model // SIAM Journal on Control and Optimization. 2003. V. 42. No. 4. P. 1466-1482.

13. MarcowitzH.M. Portfolio selection // J. Finance. 1952. V. 7. No. 1. P. 77-91.

14. Bajeux-Besnainou I., Portait R. Dynamic asset allocation in a mean-variance framework // Management Science. 1998. V. 44. No. 11. Part 2. P. S79-S95.

15. LiD., Ng W.-L. Optimal dynamic portfolio selection: multi-period mean-variance formulation // Mathematical Finance. 2000. No. 10. P. 387-406.

16. Zhou X.Y., Li D. Continuous-time mean-variance portfolio selection: a stochastic LQ framework // Applied Mathematics & Optimization. 2000. No. 42. P. 19-33.

17. Rawlings J. Tutorial: Model predictive control technology // Proc. Amer. Control Conf. San Diego. California. June 1999. P. 662-676.

Домбровский Владимир Валентинович Объедко Татьяна Юрьевна Томский государственный университет

E-mail: [email protected]; [email protected] Поступила в редакцию 17 сентября 2012 г.

Dombrovskii Vladimir V., Obyedko Tatyana Y. (Tomsk State University). Mean-variance MPC for linear systems with Markovian jumps under constraints.

Keywords: model predictive control, «mean-variance» criterion, Markovian jumps, constrains.

We consider the following Markov jump linear system with multiplicative noise

x(k +1) = Ax(k) -

u(k), (1)

B0[a(k +1), k +1] + £ Bj [a(k +1), k + 1]w j (k +1)

_ j=1

where x(k) is the nx - dimensional vector of state, u(k) is the nu - dimensional vector of control; a(k), k = 0,1,2., denotes a time-invariant Markov chain taking values in a finite set of observable states {1,2,.. ,,v} with transition probability matrix

P = [ j , i, j e {1,2,...,v}, Pv= P{a(k +1) = aj |a(k) = a,},}} = 1,

j=1

V

and initial distribution pt = P{a(o) = i}, i = 1,2,...,v; ^pt = 1; ffj(k) are independent zero-mean

i=1

random variables with unit variance and independent of the Markov chain a(k), k = 0,1,2.; A,

B,[a(k),k],j = 1,.,n, - the matrixes of corresponding dimensions, Bj[a(k),k] e {Bj1'1},j = 0,.,n, i = 1,.,v. Let y(k) = L(k)x(k) be the scalar output of the system (1), where L(k) is the vector of corresponding dimension.

The following constraints are imposed on control actions

umin(k) ^ S(k)u(k) ^ umax(kX (2)

where S(k) is the matrix of corresponding dimension.

For control of system (1) we synthesize the strategies with a predictive control model. At each step k we minimize the «mean-variance» criterion with a noving control horizon

m

J(k + m / k) = ^p1(k,i)M {(y(k + i) - M {y(k + i)/ x(k), a(k)})2 / x(k), a(k)} -i=1

-p2(k, i)M {y(k + i)/x(k), a(k)} + M {uT (k + i -1/ k )R(k, i - 1)u(k + i -1/ k)/x(k), a(k)},

on trajectories of system (1) over the sequence of predictive controls u(k/k),..., u(k+m-1/k), which depend on system’s state at moment k, under constraints (2), R(k,i)>0 is the weigh matrix of corresponding dimension, p!(k,i)>0, p2(k,i) >0 are weigh coefficients, m is the prediction horizon, k is the current moment. The synthesis of predictive control strategies is reduced to the solving of a sequence of quadratic programming tasks.

i Надоели баннеры? Вы всегда можете отключить рекламу.