Научная статья на тему 'Управление с прогнозирующей моделью стохастическими системами с марковскими скачками и сериально коррелированными параметрами при ограничениях'

Управление с прогнозирующей моделью стохастическими системами с марковскими скачками и сериально коррелированными параметрами при ограничениях Текст научной статьи по специальности «Математика»

CC BY
84
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТОХАСТИЧЕСКИЕ СИСТЕМЫ / МАРКОВСКИЕ СКАЧКИ / ЗАВИСИМЫЕ ПАРАМЕТРЫ / ПРОГНОЗИРУЮЩЕЕ УПРАВЛЕНИЕ / ОГРАНИЧЕНИЯ / STOCHASTIC SYSTEMS / MARKOVIAN JUMPS / SERIALLY CORRELATED PARAMETERS / MODEL PREDICTIVE CONTROL / CONSTRAINTS

Аннотация научной статьи по математике, автор научной работы — Домбровский Владимир Валентинович, Объедко Татьяна Юрьевна

Рассматривается задача управления с прогнозированием по квадратичному критерию для линейных дискретных систем с марковскими скачками и сериально коррелированными параметрами. Синтезированы стратегии управления при наличии явных ограничений на управляющие воздействия. Алгоритм синтеза прогнозирующей стратегии сводится к решению последовательности задач квадратичного программирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Домбровский Владимир Валентинович, Объедко Татьяна Юрьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Model predictive control for stochastic systems with Markovian jumps and serially correlated parameters under constraints

Assume that the plant to be controlled can be described by the following model: x(k +1) = A[a(k +1), k + 1]x(k) + B[a(k +1), \(k +1), k + 1]u (k), (1) where x(k) e M"x is the vector of state, u(k) e M^ is the vector of control inputs; A[a(k), k] e M"xx"x, B[a(k),n(k),k] e Кnxxnu are system and input matrices, respectively; n(k) e Кq is assumed to be a stochastic time series and all of the elements of B[n(k),k] are assumed to be linear functions of n(k); {a(k); k = 0,1,2,...} is a finite-state discrete-time Markov chain taking values in {1,2,...,v} with known transition probability matrix and initial distribution. We assume that a(k) and n(k) are mutually independent and at the instant of decision making, the current state of the market is known, i.e., the Markov state {a(k)} is observable. Let F =( Fk )k>1 be the complete filtration with a-field Fk generated by the {r|(s): s = 0, 1, 2,.,k} that models the flow of information to time k. We allow the time series n(k) to be serially correlated. Let us assume that we know the firstand second-order conditional moments for the stochastic vector n(k) about Fk: E{(k + i)/ Fk} = n(k + i), E{(k + i)nT (k + j)/ Fk} = ©t] (k), (k = 0,1,2,...), (i, j = 1,2,...,l). We impose the following constraints on the decision variables: umm (k) < S(k)u (k) < umax (k), S(k) e Mpxn, umin (k), Umax (k) e MP. (2) To control system (1) subject to constraints (2), at each step k we minimize the quadratic criterion with a receding horizon m J(k + m /k) = E{^xT (k + i)R1(k + i)x(k + i) -R2 (k + i)x(k + i) + uT(k + i -1/k)R(k + i 1)u(k + i -1/ k) / x(k), a(k), Fk}, i=1 where m is the prediction horizon; u(k/k),...,u(k+m-1/k) is the sequence of predictive controls under; R1(k+i)>0, R2(k+i)>0, and R(k+i)>0 are the weight matrices of corresponding dimensions. The model predictive control methodology was used to solve the problem. The optimal control strategies were synthesized under hard constraints imposed on the control variables.

Текст научной работы на тему «Управление с прогнозирующей моделью стохастическими системами с марковскими скачками и сериально коррелированными параметрами при ограничениях»

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

2017 Управление, вычислительная техника и информатика № 40

УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ

УДК 519.865.5

DOI: 10.17223/19988605/40/1

В.В. Домбровский, Т.Ю. Объедко

УПРАВЛЕНИЕ С ПРОГНОЗИРУЮЩЕЙ МОДЕЛЬЮ СТОХАСТИЧЕСКИМИ СИСТЕМАМИ С МАРКОВСКИМИ СКАЧКАМИ И СЕРИАЛЬНО КОРРЕЛИРОВАННЫМИ ПАРАМЕТРАМИ

ПРИ ОГРАНИЧЕНИЯХ

Рассматривается задача управления с прогнозированием по квадратичному критерию для линейных дискретных систем с марковскими скачками и сериально коррелированными параметрами. Синтезированы стратегии управления при наличии явных ограничений на управляющие воздействия. Алгоритм синтеза прогнозирующей стратегии сводится к решению последовательности задач квадратичного программирования.

Ключевые слова: стохастические системы; марковские скачки; зависимые параметры; прогнозирующее управление; ограничения.

Моделями с марковскими скачкообразными параметрами описывается широкий класс реальных систем [1]. Примерами могут служить сложные производственно-технологические, энергетические и технические системы. Гибридные системы с марковским режимом переключений также широко используются в финансовой инженерии для описания поведения инвестиционного портфеля на финансовом рынке с переключающимися режимами [2].

В таких моделях предполагается, что смена структуры системы осуществляется в соответствии с эволюцией марковской цепи с конечным пространством состояний. Решению различных задач управления и оценивания для таких систем посвящено значительное количество работ [3-9].

Эффективным подходом к синтезу систем управления с ограничениями, получившим широкое признание и применение в практике управления сложными технологическими процессами, является метод управления с прогнозирующей моделью (управление со скользящим горизонтом) [10, 11]. В работе [12] рассматривается задача синтеза прогнозирующего управления системами с марковскими скачками и мультипликативными шумами при ограничениях на управляющие воздействия, при этом предполагается, что матрица динамики системы не зависит от состояния цепи Маркова. В [13] синтезированы стратегии управления такими системами по критерию «mean-variance». В работе [14] рассматривается задача управления системами с марковским переключением режимов при условии, что матрицы динамики и управления зависят от скачков. Задача прогнозирующего управления системами с сериально коррелированными параметрами при ограничениях рассмотрена в работе [15].

В настоящей работе рассматривается задача синтеза стратегий управления с прогнозированием для дискретных линейных систем с марковскими скачками и сериально коррелированными параметрами, для которых известны только первые и вторые моменты распределений. Динамика системы определяется состоянием однородной марковской цепи с известной матрицей переходных вероятностей. Получены уравнения синтеза оптимальных стратегий управления с учетом «жестких» ограничений на управляющие переменные.

1. Постановка задачи

Пусть объект управления описывается уравнением

x( k +1) = A[ a(k +1), k +1] x(k) + £[a( k +1), ц{к +1), k + 1]u(k), (1)

где х(к) е К"х - «х-мерный вектор состояния, и (к) е К"и - «„-мерный вектор управления;

А[а(к), к] е К"хХ"х, 5[а(к),п(к),к] е К"ххи" - матрицы соответствующих размерностей; "л(к) е К9 - последовательность сериально коррелированных случайных величин; 5[а(к),п(к),к] зависит от п(к) линейно; а(к) (к = 0,1,2,..^) - однородная дискретная марковская цепь с конечным множеством состояний {1,2,... /V}, известной матрицей переходных вероятностей:

Р = [Р],(,, ] = 1^), Ру = Р{а(к +1) = а} |а(к) = аг}, £ Ру = 1,

}=1

и известным начальным распределением

р, = Р{а(0) = /},(/ = ), £ р, = 1.

,=1

Матрицы А[а(к),к] и 5[а(к),п(к),к] определяются состоянием а, марковской цепи а(к) из множеств

А[а(к),к] е {А(,)(к) е К«Х«х .,= ^,

5[а(к), п(к), к] е {5(,)[п(к),к] е К«хх«„ ^}.

Предполагается, что состояние марковской цепи в момент времени к доступно наблюдению. Последовательности а(к) и п(к) независимы.

Пусть Р =( §к )к>1 - поток о-алгебр, где каждая о-алгебра порождается последовательностью {п(^): 5 = 0,1,.,к} и интерпретируется как доступная информация до момента времени к включительно. Для процесса п(к) предполагаются известными условные моменты распределений

Е {п(к +,)/ $к }= П(к +,), (2)

Е {п(к + ,)пт(к + у)/ & } = ©у (к), (3)

(к = 0,1,2,...), (/, з = 1,2,..., I). На управляющие воздействия накладываются ограничения вида

птт(к) < 5(к)и(к) <„тах(к), (4)

где 5(к)е Крх«и ; итт(к),„т^к) е Кр .

Необходимо определить закон управления системой (1) при ограничениях (4) из условия минимума критерия со скользящим горизонтом управления

т .

J (к + т / к) = £ Е{хт (к +,) Я1 (к +,) х(к +,) / х(к), а(к), } -

Ы (5)

т т-1 .

-£ Я2 (к +,) Е{х(к +,) / х(к), а(к), } + £ Е{ит(к +, / к) Я(к + ,)и (к +, / к) / х(к), а(к), £к},

,=1 ,=0

где Е{.../...} - оператор условного математического ожидания; т - горизонт прогноза; к - текущий момент времени; Я\(к+,) > 0, Л2(к+,') > 0 и Л(к+,') > 0 - весовые матрицы соответствующих размерностей.

Для решения сформулированной задачи используем методологию управления с прогнозирующей моделью. Данный подход позволяет получить стратегии управления с обратной связью с учетом явных ограничений на управляющие воздействия.

Стратегии управления с прогнозированием определяются по следующему правилу. На каждом шаге к минимизируем функционал (5) по последовательности прогнозирующих управлений и(к/к),...,и(к+т-1/к), зависящих от состояния системы в момент времени к. В качестве управления в момент времени к берем и(к) = и(к/к). Тем самым получаем управление и(к) как функцию состояний х(к) и а(к)=аз, т.е. управление с обратной связью. Чтобы получить управление и(к+1) на следующем шаге, процедура повторяется для следующего момента к + 1 и т.д.

2. Синтез стратегий прогнозирующего управления

Цепь Маркова с дискретным временем допускает следующее представление в пространстве состояний [16]:

0(k +1) = P0(k) + u(k +1), (6)

где 0(k)=[5(a(k),1),...,5(a(k),v)]T, 5(a(k)j) - функция Кронекера (j = 1,v); u(k+1) - мартингал-разность с характеристиками

E {u(k +1)/ 0(k )} = 0,

C (k +1) = E{u( k +1) uT (k +1) / 0(k)} = diag{P0( k)} - Pdiag{0(k )}PT. С учетом (6) систему (1) можно представить в следующем виде:

x(k +1) = A[9(k +1), k + 1]x(k) + B[9(k +1), ^(k +1), k + 1]u (k), (7)

где матрицы A[0(k),k] и B[0(k),n(k),k] имеют вид

A[0(k), k ] = ¿0,. (k) A(i)(k), (8)

i=1

B[0(k), n(k), k ] = ¿0, (k) B(i)[n(k), k ], (9)

где 0i(k) (i = 1,v) - компоненты вектора 0(k). Критерий (5) будет иметь вид

m .

J(k + m / k) = £ E{xT (k + i)R (k + i)x(k + i) / x(k), 0(k),Fk} -

.=1 (10)

m m-1 .

-£ R2(k + i)E{x(k + i) / x(k), 0(k), Fk } + £ E{uT(k + i / k)R(k + i)u(k + i / k) / x(k), 0(k), Fk }.

i=1 i=0

Теорема. Пусть динамика системы описывается выражением (1) с учетом ограничений (4). Тогда стратегия прогнозирующего управления с горизонтом прогноза m минимизирующая критерий (5) на каждом шаге k равна

u (k) = [ I„u 0Иц ... 0Иц ] U (k), (11)

где In - единичная матрица размерности nu; 0n - квадратная нулевая матрица размерности nu;

U(k) = [uT(k/k),...,uT(k+m-1/k)]T - вектор прогнозирующих управлений, который определяется из решения задачи квадратичного программирования с критерием вида

Y(k + m / k) = [2xT(k)G(k) - F(k)]U(k) + UT(k)H(k)U(k) (12)

при ограничениях

Umin(k) < S(k)U(k) < Umax(k), (13)

где

S (k) = diag(S (k),..., S (k + m -1)),

Umin(k) = ^ ),...,umin(k+m-1)] ,Umax(k) = [urL(k),...,umax(k+m-1)

H(k),G(k),F(k) - блочные матрицы вида H(k) = {Hts(k}}, G(k) = {Gt(k)}, F(k) = {Ft(k)}, 5,' = 1,m , блоки которых определяются выражениями

Htt(k) = £ E{(B(i')[^(k +1),k + '])TQ(i')(k)Bj')[^(k +1),k +']/Fk} + R(k +'-1), (14)

i,=1

Hts(k) = ¿X ¿X ... £ E{(B(it)[n(k +1),k +1])T(A(i'+1)(k +1 + 1))T... (A(i'\k + 5))T x

t=1+1=1 5=1 (15)

xQ(it,...,i-}(k)B(i-)[n(k + 5), k + 5]/ Fk }, 5 >',

HSJ (k) = hT (k), 5 <', (16)

5,t

G,(k) = £ ... £ (A(i1)(k + 1))T...(A(it}(k +'))TQ(i1,i2,.. ,it}(k)E{B(i'}[n(k +'),k +']/ Fk}, (17)

.1 =1 =1

Ъ(к) = У Ф\к)Е{В(1'^(к + '),к + ']/&}. (18)

>,=1

Последовательность матриц О(1'),О" ), 5t = 1,т, представляет собой обратную рекурсию:

О( 1'..' )(к) = ©( 1'..' )(к) Я (к + 5) + У (чк + 5 +1)) О" (к )Л '5+1 (к + 5 +1),

1*+1=1У ' (19)

' = 1, т - 2," < 5 < т,

О(1")(к) = в"Р"9(к)ЯДк +") + У (Л(г"+1)(к +" + 1))Т О''t+l)(k)Л(lt+l)(k +" +1), " = 1,т -1, (20)

%+1=1

О21")(к) = Я2(к + 5)0(1",■ }(к) + У о2".....'1+1)(к)Л(15+1)(к + 5 +1), " = 1,т - 2,' < 5 < т, (21)

4+1 =1

О(")(к) = Я2(к +"^Р"9(к) + У О21", 1'+1)(к)Л( 1"+1)(к +" +1), ' = 1,т -1, (22)

" 1+1 =

с начальными условиями

О( т)(к) = е Рт9(к)Я1(к + т),

О(1'..^т )(к) = 0(1' '...''m )(к )^1(к + т), ' = 1, т -1,

О("'...'т )(к) = Я2(к + т)0( ^т )(к), ' = 1, т -1, О2тЧк) = Я2(к + т)етРт9( к),

где

0(1',..'ls) = Р Р Р 9 (к +' / к), ' = 1, т -1,5 >', (23)

91" (к +' / к) - компоненты вектора прогноза:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9(к +' / к) = Е {9(к +') / 9(к)} = Р" 9(к), е^ = [0'...'0'1'0'...'0]lxv, ц = 1, V,' = 1, т.

Замечание. Принимая во внимание предположение о линейной зависимости матриц B[n(k+')'k+'] от п(к+1 ), выражения (14), (15) вычислимы без принципиальных затруднений при условии известных первых и вторых моментов (2), (3) для процесса п(к+1). Доказательство. Введем обозначение:

Jk+5 = Е{ хТ (к +1) Я1 (к +1) х( к +1) - Я2( к +1) х( к +1) + и Т (к) Я( к) и( к) / х( к), 9(к), £к} + +Е{хТ (к + 2) Я1 (к + 2) х(к + 2) - Я2(к + 2) х(к + 2) + и Т(к + 1)Я(к + 1)и(к +1) / х(к), 9(к), %к} +... +Е{хТ (к + 5) Я1 (к + 5) х(к + 5) - Я2(к + 5) х(к + 5) + +и Т(к + 5 -1) Я(к + 5 - 1)и (к + 5 -1) / х (к), 9(к), }, 5 = 1т. Очевидно, что справедливо следующее выражение:

Jk+5+1 = Jk+э + Е{хТ (к + 5 +1) Я1 (к + 5 +1) х(к + 5 +1) - Я2(к + 5 +1) х(к + 5 +1) + +иТ (к + 5) Я(к + 5)и(к + 5) / х(к), 9(к), £к},

^Г (к + т / к ) = Jk+т .

Рассмотрим Jk+1:

Jk+1 = Е{хТ (к +1) Я1 (к +1) х(к +1) - Я2(к +1) х(к +1) + и Т(к) Я(к )и (к) / х(к), 9(к), %к}. (24) Подставляя х(к+1) из (1) в (24) и используя представление цепи Маркова в виде (6), получим

Jk+1 = Е{хТ(к(Л(ч) (к +1))Т Я1 (к +1)Л(11) (к +1)9 ч (к +1)9 Л (к +1)х(к) +

Ч =1 11 =1

V V

+ и т (к)£ £ (В ^[ф +1), к + 1])т Я1 (к + 1)В(л)[\(к +1), к + 1]0г1 (Л +1)9 л (Л + 1)и(к) +

ч = >1=

V V

+ 2хт (к)£ £ (А(г1) (к +1))т Яг(к + 1)В(л)[\(к +1), к +1]0ч (к +1)0 л (к + 1)и(к) -

'1= >1=

V

- Л2(к + 1)£0г1 (к + 1)[А(г1)(к +1) х(к) + В(г1)[\(к +1), к + 1]и(к)] + '1 =1

+ит (к) Я(к )и(к) / х(к), 0(к), £к }. Заметим, что 0^ (к +1)0> (к +1) ф 0 только при ц = }х. Кроме того, так как 0г. (к +1) - функция

Кронекера, то 02 (к +1) = 0^ (к +1). Взяв математическое ожидание, выражение для ¿к+\ можно переписать в виде

V

Зк+1 = Е{х т (к )£ (А (ч) (к +1))т Яг(к +1) А(,1) (к + 1)Е^ Р0(к) х(к) + '1=1

+ит(к / к) £ Е{(В(г1}[п(к +1), к + 1])т Л1(к +1) Вй)[ п(к +1), к +1] / £к Ц Р0(к)и (к / к) + '1=1 1

+2хт (к) £ (А1) (к + 1))т ^(к +1)Е{В('1)[ц(к +1), к +1]/ £к Ц Р0(к)и (к / к) -

'1 =1 1

-Д2 (к +1) £ вк Р0(к)[ А1) (к +1) х(к) + Е{В('1) [г|(к +1), к +1]/ £к }и(к / к)] +

'1=1 1

+ и т(к / к) Л(к )и (к / к). Аналогично на втором шаге имеем •4+2 = •+1 + Е{хт (к + 2) Я1 (к + 2) х(к + 2) - Я2(к + 2) х(к + 2) + и т(к + 1)Д(к + 1)и(к +1) / х(к), 0(к), }. Используя уравнение динамики системы (1) и представление цепи Маркова в виде (6), получим после взятия математических ожиданий

V

•к+2 = х т (к )£ (А(г1)(к + 1))т 0(г1) (к )А(г1) (к +1) х(к) + '1 =1

+2хт(к) £ (А0'1)(к + 1))т0й)(к)Е{В(г>)[п(к +1),к +1]/ }и(к / к) + '1=1

+ит(к / к) £ Е{( В('1 )[п(к +1), к + 1])т 0й) (к) В('1 )[п(к +1), к +1]/ $к }и(к / к) + '1=1

+ит(к +1/ к) £ Е{(В('2)[\(к + 2),к + 2])т0('2) (к)В02) [\(к + 2), к + 2]/ $к }и(к +1/ к) + '2 =1

+2и т(к / к) £ Е{(В('1) [п(к +1), к + 1])т £ (А('2) (к + 2))т0('!,'2) (к )В('2 )[п(к + 2), к + 2]/ %к }и(к +1/ к) -'1 =1 '2

-£ 024)А(0(к +1)х(к) - £ 02°Е{В('1)[п(к +1),к +1] /&}и(к/ к) -

'1 =1 '1 =1

- £ 02'2)Е{В('2)[п(к + 2), к + 2]/ £к }и(к +1/ к) + '2 =1

+ и т (к / к )Д (к )и (к / к) + и т (к +1/ к) Л (к + 1)и (к +1/ к),

где матрицы 0('' )(к), 0('' )(к), 02'' )(к) определяются уравнениями (19)-(22). Повторяя процедуру для •к+3, •к+4,..., получим выражение для ¿(к+т/к):

J (к + m / к) = x T (к )£ (Aih)(k + 1))T Q(il) (k) A(il) (k +1) x(k) +

¿1=1

m v v

+2xT (k )SS... S A) (k + 1))T...(A('t )(k + t ))TQ(i1 ,'2 ) (к )E{B('t) [n(k +1), к +1 ]/ Fk }u(k +1 -1/ к) +

t =Ц =1 ,, =1

mv

+S u T(k +1 -1/ к)[ S E{( B('t )[n(k +1), к +1 ])T Q('t) (k) B('t )[n(k +1), к +1 ]/ Fk} + R(k +1 - 1)]u(k +1 -1/ к) + t=1 't=1 m-1 m v v v

+2S S UT(k +1-1/k)S E{(B('t)[n(k +1),к + t])T S ...S (A('t+1)(k +1 + 1))T...(A('*)(k +

t=1 s =t+1 it =1 't+1=1 is =1

xB('s)[n(k + s),к + s]/ Fk}u(k + s -1/ к) -

v m v

-S Q2'1)A1)(k +1)x(k) - S S Q2't)E{B('t)[л(к +1),к +1]/ Fk}u(k +1 -1/ к), '1=1 t=1't =1

где матрицы Q(t )(k), Q(t)(k), Q(t )(k) определяются уравнениями (19)-(22). Критерий J(k+m/k) может быть записан в матричном виде:

J (к + m / к) = xT (к) S (A( '1)(к + 1))T Q( '1)(к) A( '1)(к +1) x(k) - S Q2'1) A( '1)(k +1) x(k) + (25)

'1 =1 '1 =1

+[2 xT (k )G(k) - F (к )]У (k) + U T (k) H (k )U (k), где матрицы H(k), G(k), F(k) имеют вид (14)-(18).

Минимизация данного критерия эквивалентна минимизации критерия вида

Y(к + m / к) = [2xT (k)G(k) - F(k)]U(k) + UT (k)H(k)U(k). Таким образом, имеем задачу минимизации критерия (12) при ограничениях (13), которая эквивалентна задаче квадратичного программирования с критерием (5) при ограничениях (4).

Заключение

В данной работе предложен метод синтеза стратегий прогнозирующего управления по квадратичному критерию для линейных дискретных систем с марковскими скачками и сериально коррелированными параметрами. Данный подход позволяет в явном виде учесть ограничения на управления. Алгоритм синтеза прогнозирующей стратегии включает решение последовательности задач квадратичного программирования.

ЛИТЕРАТУРА

1. Пакшин П.В. Дискретные системы со случайными параметрами и структурой. М. : Физматлит, 1994.

2. Dombrovkii V., Obedko T. Portfolio Optimization in the Financial Market with Regime Switching under Constraints and Transaction

Costs Using Model Predictive Control // European Control Conference (ECC). July 2015. P. 3371-3376.

3. Пакшин П.В., Ретинский Д.М. Робастная стабилизация систем случайной структуры с переключаемой статической обратной

связью по выходу // Автоматика и телемеханика. 2005. № 7. C. 135-147.

4. Смагин В.И., Поползухина Е.В. Синтез следящих систем управления для объектов со случайными скачкообразными пара-

метрами и мультипликативными возмущениями // Вестник Томского государственного университета. 2000. № 271. С. 171175.

5. Blackmore L., Bektassov A., Ono M., Williams B.C. Robust optimal predictive control of jump Markov linear systems using parti-

cles // Lecture Notes in Computer Science. 2007. V. 4416. P. 104-117.

6. Costa O.L.V., Okimura R.T. Discrete-time mean-variance optimal control of linear systems with Markovian jumps and multiplicative

noise // International Journal of Control. 2009. V. 82, No. 2. P. 256-267.

7. Costa O.L.V., Oliveira A. Optimal mean-variance control for discrete-time linear systems with Markovian jumps and multiplicative

noises // Automatica. 2012. V. 48, No. 2. P. 304-315.

8. Dragan V., Morozan T. The Linear Quadratic Optimization Problems for a Class of Linear Stochastic Systems with Multiplicative

White Noise and Markovian Jumping // IEEE Transactions on Automatic Control. 2004. V. 49, No. 5. P. 665-675.

9. Li X., Zhou X.Y. Indefinite stochastic LQ control with Markovian jumps in a finite time horizon // Communications in Information

and Systems. 2002. No. 2. P. 265-282.

10. Mayne D.Q. Model predictive control: Recent developments and future promise // Automatica. 2014. V. 50. P. 2967-2986.

11. Rawlings J. Tutorial: Model Predictive Control Technology // Proc. Amer. Control Conf. San Diego. California. June 1999. P. 662676.

12. Домбровский В.В., Объедко Т.Ю. Управление с прогнозированием системами с марковскими скачками при ограничениях и применение к оптимизации инвестиционного портфеля // Автоматика и телемеханика. 2011. № 5. С. 96-112.

13. Домбровский В.В., Объедко Т.Ю. Управление с прогнозирующей моделью линейными системами с марковскими скачками по критерию «mean-variance» при ограничениях // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2012. № 4 (21). С. 5-13.

14. Домбровский В.В., Самородова М.В. Управление с прогнозированием по квадратичному критерию линейными дискретными системами с марковскими скачками при ограничениях // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2016. № 1 (34). С. 4-10.

15. Dombrovslii V., Obedko T. Model predictive control for constrained systems with serially correlated stochastic parameters and portfolio optimization // Automatica. 2015. V. 54. P. 325-331.

16. Elliott R.J., Aggoun L., Moore J.B. Hidden Markov Models: Estimation and Control. Berlin : Springer-Verlag, 1995.

Домбровский Владимир Валентинович, д-р техн. наук, профессор. E-mail: [email protected] Объедко Татьяна Юрьевна, канд. физ.-мат. наук. E-mail: [email protected] Национальный исследовательский Томский государственный университет

Поступила в редакцию 25 февраля 2017 г.

Dombrovskii Vladimir V., Obedko Tatiana Y. (National Research Tomsk State University, Russian Federation).

Model predictive control for stochastic systems with Markovian jumps and serially correlated parameters under constraints.

Keywords: stochastic systems; Markovian jumps; serially correlated parameters; model predictive control; constraints.

DOI: 10.17223/19988605/40/1

Assume that the plant to be controlled can be described by the following model:

x(k +1) = A[a(k +1), k + 1]x(k) + B[a(k +1), -q(k +1), k + 1]u (k), (1)

where x(k) e M"x is the vector of state, u(k) e M" is the vector of control inputs; A[a(k),k] e M"xx"x, B[a(k),n(k),k] e Кnx

are system and input matrices, respectively; n(k) e Кq is assumed to be a stochastic time series and all of the elements of B[n(k),k] are assumed to be linear functions of n(k); {a(k); k = 0,1,2,...} is a finite-state discrete-time Markov chain taking values in {1,2,...,v} with known transition probability matrix and initial distribution. We assume that a(k) and n(k) are mutually independent and at the instant of decision making, the current state of the market is known, i.e., the Markov state {a(k)} is observable. Let F =( Fk )k>i be the complete filtration with a-field Fk generated by the {n(s): s = 0, 1, 2,.,k} that models the flow of information to time k. We allow the time series n(k) to be serially correlated. Let us assume that we know the first- and second-order conditional moments for the stochastic vector n(k) about Fk:

E{(k + i)/ Fk} = n(k + i), E{(k + i)nT (k + j)/ Fk} = © j (k), (k = 0,1,2,...), (i, j = 1,2,...,l).

We impose the following constraints on the decision variables:

"min (k) < S(k)u (k) < umax (k), S(k) e M^, u^ (k), ^ax (k) e Mp. (2)

To control system (1) subject to constraints (2), at each step k we minimize the quadratic criterion with a receding horizon

m

J(k + m /k) = E{£xT(k + i)R1(k + i)x(k + i) -R2(k + i)x(k + i) + uT(k + i -1/k)R(k + i - 1)u(k + i -1/k) /x(k),a(k),Fk},

i=1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

where m is the prediction horizon; u(k/k),...,u(k+m-1/k) is the sequence of predictive controls under; R1(k+i)>0, R2(k+i)>0, and R(k+i)>0 are the weight matrices of corresponding dimensions.

The model predictive control methodology was used to solve the problem. The optimal control strategies were synthesized under hard constraints imposed on the control variables.

REFERENCES

1. Pakshin, P.V. (1994) Diskretnye sistemy so sluchaynymi parametrami i strukturoy [Discrete-systems with stochastic parameters and

structure]. Moscow: Fizmatlit.

2. Dombrovskii, V. & Obedko, T. (2015) Portfolio Optimization in the Financial Market with Regime Switching under Constraints and

Transaction Costs Using Model Predictive Control. European Control Conference (ECC). July. pp. 3371-3376. DOI: 10.1109/ECC.2015.7331055

3. Pakshin, P.V. & Retinskii, D.M. (2005) Robust Stabilization of Random-Structure Systems via Switchable Static Output Feedback.

Automation and Remote Control. 66(7). pp. 1153-1161. DOI: 10.1007/s10513-005-0155-5

4. Smagin, V.I. & Popolzuhina, E.V. (2000) The synthesis of tracking control systems for objects with random switching parameters and

multiplicative noises. Vestnik Tomskogo gosudarstvennogo universiteta - Tomsk State University Journal. 271. pp. 171-175. (In Russian).

5. Blackmore, L., Bektassov, A., Ono, M. & Williams, B.C. (2007) Robust optimal predictive control of jump Markov linear systems

using particles. Lecture Notes in Computer Science. 4416. pp. 104-117.

6. Costa, O.L.V. & Okimura, R.T. (2009) Discrete-time mean-variance optimal control of linear systems with Markovian jumps and

multiplicative noise. International Journal of Control. 82(2). pp. 256-267. DOI: 10.1080/00207170802050825

7. Costa, O.L.V. & Oliveira, A. (2012) Optimal mean-variance control for discrete-time linear systems with Markovian jumps and mul-

tiplicative noises. Automatica. 48(2). pp. 304-315. DOI: 10.1080/00207170802050825

8. Dragan, V. & Morozan, T. (2004) The Linear Quadratic Optimization Problems for a Class of Linear Stochastic Systems with Multi-

plicative White Noise and Markovian Jumping. IEEE Transactions on Automatic Control. 49(5). pp. 665-675. DOI: 10.1109/TAC.2004.826718

9. Li, X. & Zhou, X.Y. (2002) Indefinite stochastic LQ control with Markovian jumps in a finite time horizon. Communications in In-

formation and Systems. 2. pp. 265-282. DOI: 10.4310/CIS.2002.v2.n3.a4

10. Mayne, D.Q. (2014) Model predictive control: Recent developments and future promise. Automatica. 50. pp. 2967-2986. DOI: 10.1016/j.automatica.2014.10.128

11. Rawlings, J. (1999) Tutorial: Model Predictive Control Technology. Proc. Amer. Control Conf. San Diego. California. pp. 662-676. DOI: 10.1109/ACC.1999.782911

12. Dombrovskii, V.V. & Obedko, T.Yu. (2011) Predictive control of systems with Markovian jumps under constraints and its application to the investment portfolio optimization. Automation and Remote Control. 72(5), pp. 989-1003. DOI: https://doi.org/10.1134/S0005117911050079

13. Dombrovskii, V.V. & Obedko, T.Yu. (2012) Mean-variance MPC for linear systems with Markovian jumps under constraints. Vest-nik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika - Tomsk State University Journal of Control and Computer Science. 4(21). pp. 5-13. (In Russian).

14. Dombrovskii, V.V. & Samorodova, M.V. (2016) Model predictive control with quadratic criterion for jump Markov discrete linear systems under constraints. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika -Tomsk State University Journal of Control and Computer Science. 1(34), pp. 4-10. (In Russian).

15. Dombrovslii, V. & Obedko, T. (2015) Model predictive control for constrained systems with serially correlated stochastic parameters and portfolio optimization. Automatica. vol. 54. pp. 325-331. DOI: 10.1016/j.automatica.2015.02.021

16. Elliott, R.J., Aggoun, L. & Moore, J.B. (1995) Hidden Markov Models: Estimation and Control. Berlin: Springer-Verlag.

i Надоели баннеры? Вы всегда можете отключить рекламу.