ISSN 2079-3316 ПРОГРАММНЫЕ СИСТЕМЫ: ТЕОРИЯ И ПРИЛОЖЕНИЯ №2(25), 2015, с. 29-44
УДК 517.977
М. М. Хрусталёв, Е. Е. Онегин
Аналитическое конструирование оптимальных регуляторов для квазилинейных стохастических систем, функционирующих на неограниченном интервале времени
Аннотация. Рассматривается задача оптимального управления с квадратичным критерием качества на неограниченном интервале времени квазилинейной стохастической системой, у которой отсутствует постоянное слагаемое в коэффициенте при шуме. Получено необходимое и одновременно достаточное условие оптимальности стационарного линейного регулятора. При помощи этого условия решена задача оптимальной стабилизации двух-звенного механического манипулятора.
Ключевые слова и фразы: оптимальное управление, квазилинейные системы, стохастические системы, неограниченный интервал времени, механический манипулятор.
Введение
Данная работа посвящена решению задачи оптимального управления квазилинейной системой с квадратичным критерием качества на неограниченном интервале времени. Квазилинейные системы описываются стохастическими дифференциальными уравнениями Ито вида
к
¿х(г) = (А0х(г) + в0и(г,х(г)))сИ + + Вги(г,х(г)) + с^) ¿-ш^г).
г=1
Вопросы оптимального управления такими системами прежде были рассмотрены Ю. И. Параевым [1]. Спустя некоторое время Д. С. Румянцев и М. М. Хрусталёв [2] получили условия оптимальности для квазилинейных систем при наличии информационных ограничений (информационные ограничения заключаются в том, что каждая компонента управления зависит от своего, заранее заданного набора компонент вектора состояния). Задача оптимального управления на
© М. М. Хрусталёв, Е. Е. Онегин, 2015
© Институт проблем управления имени В. А. Трапезникова РАН, 2015 © Программные системы: теория и приложения, 2015
неограниченном интервале времени при наличии информационных ограничений была решена М. М. Хрусталёвым и А. С. Халиной [3]. В общем случае квазилинейная система подвергается случайным возмущениям, вследствие чего классический квадратичный критерий принимает бесконечно большое значение. По этой причине в работе [3] используется усредненный по времени критерий качества управления.
В рассматриваемой здесь системе отсутствует постоянное слагаемое в коэффициенте при шуме:
к
¿х(г) = (А0х(г) + в0и(ь, х(г)))А + + х(г))) ¿т^г).
г=1
Известно [4], что при этом возможно обеспечить устойчивость в среднем квадратичном нулевого решения. Это позволяет решить задачу оптимального управления с классическим квадратичным критерием Лётова. Частные случаи такой задачи были изучены в работах [5-8].
В предлагаемой работе получено необходимое и достаточное условие оптимальности стационарного линейного регулятора. В качестве приложения решена задача оптимальной стабилизации двухзвенного механического манипулятора.
Постановка задачи содержится в разделе 1, в разделе 2 производится вспомогательные построения, раздел 3 содержит теоретические результаты, практический пример приведен в разделе 4.
1. Постановка задачи
Система описывается стохастическим дифференциальным уравнением Ито вида
к
, , ¿х(Ь) = /(х(Ь), х(Ъ)))(И + ^ 9г(х(1,), х(1;))) ¿'ш^^), (1) ¿=1
х(Ц) = хо,
где Ь € Т = [¿0, — время; х € Д" — вектор состояния; и € Дт — вектор управления; (Ь,х) ^ и(Ь,х) : Т х Д" ^ Дт — стратегия управления; чл^) — ^-мерный стандартный винеровский процесс; плотность распределения х ^ Ро(х) : Кп ^ К начального состояния х0 задана, имеет математическое ожидание то € Д", ковариационную матрицу К0 € Впхп и принадлежит пространству С2(Яп) дважды непрерывно дифференцируемых функций; функции (х,и) ^ /(х,и) : Д" х Дт ^
Rn и (х, и) ^ gi(x, и) : Rn х Rm ^ Rn, i = 1,к, имеют вид
f (х, и) = Аох + Вой, gi(x, и) = AiX + BiU, i = l,k,
где Ai e Rnxn, Bi e Rnxm, i = 01.
Введём в рассмотрение функции t ^ P*(t) = p(t, •) : T ^ С2(Rn) и t ^ u*(t) = u(t, •) : T ^ которые в каждый момент времени
t e Т представляют собой плотность вероятности и управление с обратной связью соответственно, где Вп,т — множество борелевских функций х ^ v(x) : Rn ^ Rm.
Обозначим через D множество процессов управления (р* (•), и* (•)) таких, что
• стратегия управления u(t,x) измерима по Борелю;
• функция p(t, х) дифференцируема по (t, х) всюду, кроме конечного числа плоскостей ti = const, i = 1, s, дважды непрерывно дифференцируема по х и при заданной стратегии управления u(t, х) описывается уравнением Фоккера-Планка-Колмогорова
ЩйТ = - Е Ш,ф(*,*)]+ it Щ (t,x)p(t,x)]
i=1 г i,j=l г 3
с начальным условием p(t0, •) = ро() где fu(t,x) = f (x,u(t,x))\ к
au(t,x) = 1 Е 9^t(t,x)g:^(t,x)T; g?(t,x) = gi(x,u(t,x)).
i=i
Пусть стратегия управления u(t, x) такова, что справедливо равенство u(t, 0) = 0. Тогда при фиксированном начальном условии x(tо) = 0 уравнение (1), замкнутое управлением u(t,х), имеет тривиальное решение x(t) = 0.
Определение 1. Решение x(t) = 0 будем называть устойчивым, если для любого е > 0 существует такое S > 0, что неравенство
М[||^)1|2] < £, Vt > to,
выполняется для любого решения x(t), которое в начальный момент времени tо имеет плотность распределения ро(х) e С2(Rn), удовлетворяющую условию
suppро С Us(0),
где М[•] — оператор математического ожидания; || • || — евклидова норма в Rn; зиррро — носитель функции ро(х); Us(х) — ¿-окрестность точки х.
Определение 2. Решение x(t) = 0 будем называть асимптотически устойчивым, если оно устойчиво, и равенство
(2) lim Мp(i)||2] =0
справедливо для любого решения x(t), которое в начальный момент времени to имеет плотность распределения ро(х) G С2(В").
Определение 3. Процесс я = (р*(•), и*(•)) будем называть стохастически устойчивым, если уравнение (1), замкнутое управлением u(t,x), имеет нулевое решение, и это решение асимптотически устойчиво.
Выделим в D подмножество D допустимых процессов управления z = (р* (•), и* (•)), удовлетворяющих условиям:
• процесс z является стохастически устойчивым;
• на процессе z принимает конечное значение функционал качества управления z ^ J(z) : D ^ R = [-то, где
(3) J(z) = j j f c(x,u(t,x))p(t,x)dxdt,
to Rn
fc(x,u) = 2xTQx+xTSu + 2uTEu; f c(x,u) > 0, У(х,и) G Rn x Rm; Q — симметрическая матрица; E — положительно определённая симметрическая матрица.
Необходимо найти такой допустимый процесс управления ~z = (р*(•),и*(•)), который будет минимизировать критерий:
(4) J (z) = min J (z).
zED
2. Функционал Лагранжа—Кротова
Рассмотрим вспомогательную задачу оптимального управления системой (1) с критерием г ^ : О ^ К, где
^ i
(5) Ji(z) = J j fc(x,u(t,x))p(t,x)dxdt,
to Rn
а t\ G (to, — некоторый фиксированный момент времени.
Следуя [9],[10], для поставленной задачи введём функционал Лагранжа-Кротова г ^ Г]^) : Б ^ R, который задаётся равенством
Г!(г) = ^0(1о,р*(1о)) - ¥0(г1,р*(г1))+ (6) + / §§ (р0(г,р*(г)) + / ъ0(1,х,и(1,х),р*(1))р(г,х)<1х л,
¿0 ^ Л" -1
где функция ^ ^0(1,д(-)) : Т х С"2(Кп) ^ Д играет роль
множителя Лагранжа [9], а (Ь,х,и,д(-)) ^ к0(Ь,х,и,д(-)) : Т х Кп х Ет х С2р(Пп) ^ Д имеет вид
п
Н0(1,х,и,д(-)) = £ Мх,и)§§-е(1,х,д(-))+
dxi
(7) ,
1 ^ gxx~x~
+ Ё aij(x,u) gX-^TC0(t,x,q(^)) + fc(x,u),
i,j = l
где C2(Rn) — некоторая окрестность множества C:^(Rn) дважды непрерывно дифференциируемых плотностей вероятности в пространстве C2(Rn). Здесь (-,t,x,q(•)) ^ f(t,x,q(•)) : Т x Rn x C^2(Rn) ^ R — производная Фреше функции <p0(t, q( )) по q( ).
Известно [9, Лемма 2], что для любой функции f0(t, q( )), удовлетворяющей указанным в [9] теоретико-функциональным требованиям, справедливо равенство
(8) ri(z) = Ji(z), Ух G D, 4ti G (to,
Ясно, что Ji(•) сходится при ti ^ к J(•) поточечно на множестве D. Тогда, учитывая этот факт и равенство (8), положим
Г(г) = lim Г^г),4z G D,
t\w
где z ^ Г(^): D ^ R — функционал Лагранжа для исходной задачи. Очевидно, что
Г(г) = lim Г^з) = lim J1(z) = J(z), 4z G D.
ti^+w ti^+w
Учитывая (6), получим
r(z) = <f0(to,p*(to)) - lim {^0(ti,P* (ti))-i +
(9) t
' " ................................ dt
г i г 1 ч
f -§-t(p0(t,p*(t)) + f h0(t,x,u(t,x),p*(t))p(t,x)dx dt\. t-,. L -I J
o
(10) к
У ' +xTSu + 1итЕи + 1 £ (AiX + BiU)TM(AiX + BiU).
Рассмотрим частный случай функционала (9), выбрав функцию , q()) постоянной по времени:
f°(t, q() = = 2 J xTMx q(x)dx,
Rn
где M € Rnxn — симметрическая матрица. Производная Фреше функции ip(q() имеет вид
i°(t,x, qO))=£(x) = 1xTMx.
Подставляя функции !;0(t,x, q(^)), f(x,u), fc(x,u),a(x,u) в (7), получим
h°(t, x, u, q(•)) = h(x, u) = (Aox + Bqu)tMx + 1xTQ x+
к
Л
Функционал (9) примет вид
Г(,г) = 1 f xTMxpo(x)dx — lim \b J xTMxp(t\,x)dx.
an L R„
(11) R tu R — h( x, u( , x)) ( , x to Rn
Расписывая условие (2) стохастической устойчивости, можно получить следующее равенство
lim (xTx)p(t ,x)dx = lim (tr{K (i)} + m(t)Tm(t)) = 0,
t^+wj V У
Rn
где tr{K(i)} — след матрицы K(t). Отсюда следует, что условие (2) равносильно равенствам
(12) , lim \\Kw\\ = o, t lim \ыт = o.
При этом если учесть равенство
(13) J xTMxp(t,x)dx = tr{MK(t)} + m(t)TMm(t), то для любого процесса z € D функционал (11) примет вид
+w
(14) r(z) = 1 f xTMxpo(x)dx + j j h(x,u(t,x))p(t,x)dxdt.
21 x
Rn to Rn
3. Условия оптимальности
Используя результаты [3], доказано следующее утверждение о стохастически устойчивых процессах с управлением в виде линейного регулятора:
Лемма 1. Если процесс г = (р*(-),и*(-)) € Б, где и(Ь,х) = —Ьх, Ь € Втхп, является стохастически устойчивым, то существует неотрицательно определённая матрица М, которая удовлетворяет уравнению
Af М + MAß + £ Af MAU + Q - SL-(15) =i
-LT ST + LT EL = 0,
(16) J (z) = - tr[MK0] + - Mm0.
где Aß = Ai - BiL, i = 0, k, а значение критерия для этого процесса задаётся равенством
2 tr{MKo} + 2
Идея доказательства состоит в том, что стохастическая устойчивость процесса обеспечивает асимптотическую устойчивость уравнений для математического ожидания и ковариации, откуда следует существование решения уравнения (15). При этом для соответствующей функции <p(q(•)), благодаря стохастической устойчивости, критерий будет определяться равенством (16), откуда следует, что найденная матрица М является неотрицательно определённой.
При помощи указанной леммы была доказана теорема о необходимых и достаточных условиях оптимальности линейного стационарного регулятора:
Теорема 1. Для того, чтобы процесс z = (р*(•), и*(•)) G D, с управлением в виде u(t,x) = -Lx, L G Rmxn, был оптимальным, необходимо и достаточно существование неотрицательно определённой матрицы М, удовлетворяющей уравнению (15), такой, что выполнено условие
(17) h(x,u(t,x)) = min h(x,u), 4(t,x) G T x Rn.
Достаточность легко показать при проверке условия оптимальности (4), используя для вычисления значения критерия функци-ал Лагранжа-Кротова. Необходимость доказывается от противного. Предположив, что эти условия не выполнены, можно сконструировать стохастически устойчивый процесс управления с управлением в
виде линейного нестационарного регулятора, значение критерия для которого будет лучше оптимального.
Условиям теоремы 1 можно придать следующий, более конструктивный вид:
Теорема 2. Для того, чтобы процесс г = (р*(•), и*(•)) € Б, с управлением в виде и(Ь,х) = —Ьх, Ь € Ктхп, был оптимальным, необходимо и достаточно существование неотрицательно определённой матрицы М, удовлетворяющей условиям:
к к (18) Ь = (Е + ^в1мв^-\в7;м + ^ВТ1МА1 + ЯТ),
(19)
А%ТМ + МА$ + £ А?ТМА? + << — ЯЬ — ЬТЯТ+
г=1
+ЬТЕЬ = 0,М > 0,
(20) А? = Аi —В^Ь,г = 0,к.
При этом оптимальное значение критерия определяется равенством
1-1г{МК0} + 2
(21) 7 (г) = -Ьг{МК0} + -тТМт0.
Если приглядеться к определению 3 стохастической устойчивости процесса управления и формулировкам теорем, то можно заметить, что нигде в доказательствах не использовалась функция плотности распределения начального состояния. Таким образом, полученный результат будет справедлив при любой начальной плотности распределения.
Определение 4. Линейный стационарный регулятор назовем универсальным, если при любой заданной начальной плотности ро(•) € С2(Нп) соответствующий процесс управления является оптимальным.
Теорема 3. Оптимальный регулятор и(х) = —Ьх, удовлетворяющий условиям теоремы 1, является универсальным.
4. Оптимальная стабилизация двухзвенного манипулятора
Рассмотрим задачу оптимального управления двухзвенным механическим манипулятором (Рис. 1 [11]).
На горизонтальной плоскости находится двухзвенный механический манипулятор, каждое звено которого представляет собой абсолютно жёсткий стержень длиной Iг, г = 1, 2. Первое звено соединено с неподвижным основанием манипулятора вращательной парой 0\, а со вторым звеном — вращательной парой 02. Масса схвата манипулятора — т, центр масс ¿-го звена находится в середине стержня — точке Сг, его масса — тг, момент инерции ¿-го звена относительно своего центра масс — , г = 1, 2. В соединительных парах могут развиваться управляющие моменты щ и и2. На плоскости, в которой расположен манипулятор, проведена прямолинейная ось 0\х. Через обозначим угол, образованный г-м звеном манипулятора с осью 0\х, угловую скорость обозначим через , г = 1, 2 [11].
Линеаризованное в окрестности точки рг = р*, рг =0, иг = 0, г = 1, 2 уравнение движения имеет вид [11,12]
(22) (х(г) = (А0х(г) + в0и(г, х(г))а, х(г 0) = х0,
где х = (хх,х2,хз,х4)Т, х= р(0 - р*, х2^) = (2^) - р2, хз(г) =
Ао =
а = 4[12(тг +4т2 + 4т) + 411], Ь= 4[1%(т2 + 4т) + ], с= 2(2т + т2)кЬ соб(р1 - р*).
Теперь положим, что на управление воздействуют мультипликативные случайные возмущения, и начальное состояние х0 является случайной величиной с математическим ожиданием т0 и ковариационной матрицей К0.
) = р2 (£); и = (иг,и2)Т; р* е Я2, р* = (р* )Т;
(0 01 0\ 0 0\
0 00 1 = 1 0 0
0 00 0 , 0 аЬ - с2 соъ2 (р* -р*) -с
\0 00 0 - а
Выберем следующие параметры манипулятора: т = 2 кг, т1 =
I-
2 =
20 кг, т2 = 10 кг, 11 = 1 м, I- = 0.5 м, 11 = 1.667 кг • 0.208 кг • м2. Начальные математическое ожидание то и ковариа-
ционную матрицу К зададим следующим образом: то К0 = (Над(0.25,0.25, 0.25, 0.25).
При р* = система управления примет вид
(0, 0, 0,0)Т
(23)
¿х(1й) = (Аох(1) + Вои(Ь, х(Ь))А + , х(1))с!щ(1),
=1
х(г о) = х0,
где ш(^) — двумерный стандартный винеровский процесс,
Ао
0 0 0 0
0 1 0 0
Во
В
0 0
0.0424
0 0 0
В2
0 0
0.106 \—0.277 0 0
—0.1108 0
0 0
—0.277 0.1478/ 0 \ 0
0 —0.0831 У0 0.4434 )
Необходимо решить задачу оптимального управления системой (23)
с критерием качества управления
+^
1(р*(),и*(•)) = ! J ¡с(х,и(1 ,х))р(Ь,х)(1х(И,
0 Д™
где /с(х, и) = -хТ<х + хТЯи + 1иТ Еи, < = (Над(1,1,0.5,0.5), Е = ¿гад(0.5, 0.5),
/0.5 0 \ 0 0.06 0 0 00
При помощи полученных условий оптимальности была найдена матрица коэффициентов Ь оптимального линейного стационарного регулятора и оптимальное значение критерия 7:
3.998 0194 10.616 1.673\ —0.300 1.441 0.723 1.755 , 7 = 16.331.
Я -
Ь
На Рис. 2-5 приведены результаты моделирования поведения системы при найденном управлении и заданном начальном состоянии х0 = (—0.01, 0.3, —0.09, 0.25)Т на интервале времени [0, 30]. Красными пунктирными линиями изображено поведение соответствующих компонент системы без наличия случайных воздействий (22).
Рис. 2. График х\ (£)
Рис. 3. График Х2(£)
Как видно из графиков, несмотря на погрешности в управлении, даже за небольшой конечный промежуток времени удаётся привести систему к нулевому состоянию.
Рис. 4. График Жз(£)
Рис. 5. График Х4(£)
5. Заключение
Рассмотрена задача оптимального управления с квадратичным критерием качества на неограниченном интервале времени квазилинейной системой, у которой отсутствует постоянное слагаемое в коэффициенте при шуме. Получено необходимое и одновременно достаточное условие оптимальности стационарного линейного регулятора. Введено понятие универсального регулятора и показано, что оптимальный регулятор, удовлетворяющий найденному необходимому и достаточному условию, является универсальным. Получены условия оптимальности стационарного линейного регулятора в виде системы алгебраических уравнений. С их помощью решена задача оптимальной стабилизации двухзвенного механического манипулятора.
Список литературы
[1] Ю. И. Параев, Введение в статистическую динамику процессов управления и фильтрации, Библиотека технической кибернетики, Советское радио, М., 1976, 184 с. t 29.
[2] Д. С. Румянцев, М. М. Хрусталёв. «Оптимальное управление квазилинейными системами диффузионного типа при неполной информации о состоянии», Изв. РАН. Теория и системы управления, 2006, №5, с. 43-51 t 29.
[3] М. М. Хрусталёв, А. С. Халина, «Условия стабилизируемости и оптимальности квазилинейных стохастических систем при неполной обратной связи на неограниченном интервале времени», Труды XII Всероссийского совещания по проблемам управления, ВСПУ-2014 (Россия, Москва, 16-19 июня 2014 г.), ИПУ РАН, М., 2014, с. 1126-1134 t 30, 35.
[4] J. L. Willems, J. C. Willems. "Feedback stabilizability for stochastic systems with state and control dependent noise", Automatica, 12 (1976), pp. 277-283 t 30.
[5] W. M. Wonham. "Optimal stationary control of a linear system with state-dependent noise", SIAM Journal Control, 5:3 (1967), pp. 486-500 30.
[6] D. L. Kleinman. "Optimal stationary control of a linear system with control-dependent noise", IEEE Transactions on Automatic Control, 14:6 (1969), pp. 673-677 t 30.
[7] P. J. McLane. "Optimal stochastic control of linear systems with state-and control-dependent disturbances", IEEE Transactions on Automatic Control, 16:6 (1971), pp. 793-798 t 30.
[8] U. G. Haussmann. "Optimal stationary control with state and control dependent noise", SIAM Journal on Control, 9:2 (1971), pp. 184-198 t 30.
[9] М. М. Хрусталёв. «Условия равновесия по Нэшу в стохастических дифференциальных играх при неполной информированности игроков о состоянии, 1», Изв. РАН. Теория и системы управления, 1995, №6, с. 194-208 t 33.
[10] М. М. Хрусталёв. «Условия равновесия по Нэшу в стохастических дифференциальных играх при неполной информированности игроков о состоянии, 2», Изв. РАН. Теория и системы управления, 1996, №1, с. 72-79 t 33.
[11] С. В. Лутманов. Линейные задачи оптимизации. Т. 2: Оптимальное управление линейными динамическими объектами, Пермский государственный университет, Пермь, 2005, 195 с. t 36, 37.
[12] М. М. Хрусталёв, Д. С. Румянцев, К. А. Царьков. «Алгоритм поиска квазиоптимальных стратегий управления динамическими стохастическими системами диффузионного типа», Изв. РАН. Теория и системы управления, 2014, №1, с. 74-86 ^ 37.
Рекомендовал к публикации д.т.н. В. И. Гурман
Об авторах:
Михаил Михайлович Хрусталёв
Главный научный сотрудник лаборатории №45 Института проблем управления им. В.А. Трапезникова РАН, д.ф.-м.н., профессор; область научных интересов — теория оптимального управления стохастическими системами.
e-mail: [email protected]
Евгений Евгеньевич Онегин
Математик лаборатории №45 Института проблем управления им. В.А. Трапезникова РАН; область научных интересов — теория оптимального управления стохастическими системами.
e-mail: [email protected]
Пример ссылки на эту публикацию:
М. М. Хрусталёв, Е. Е. Онегин. «Аналитическое конструирование оптимальных регуляторов для квазилинейных стохастических систем, функционирующих на неограниченном интервале времени», Программные системы: теория и приложения, 2015, 6:2(25), с. 29-44. УР1_ Ьггр://рзга.рз1га8 .ги/геаа/рзга2015_2_29- 44.pdf
Mikhail Khrustalev, Evgeny Onegin. Analytical design of controllers for quasi-linear systems on the infinite time interval.
Abstract. This paper discusses the optimal control problem of the time invariant quasi-linear systems on the infinite time interval. Necessary and sufficient condition for the optimal feedback control are presented. Using this condition, the mechanical manipulator optimal control problem has been solved. (In Russian).
Key Words and Phrases: optimal control, quasi-linear systems, stochastics systems, infinite time interval, mechanical manipulator.
References
[1] Yu. I. Parayev, Introduction to Statistical Process Control dynamics and filtering, Biblioteka tekhnicheskoy kibernetiki, Sovetskoye radio, M., 1976, 184 p.
[2] D. S. Rumyantsev, M. M. Khrustalev. "Optimal control of quasi-linear systems of the diffusion type under incomplete information on the state", Journal of Computer and Systems Sciences International, 45:5 (2006), pp. 718—726.
[3] M. M. Khrustalev, A. S. Khalina, "Terms stabilizability and optimality of quasilinear stochastic systems with incomplete feedback on an unlimited time interval", Trudy XII Vserossiyskogo soveshchaniya po problemam upravleniya, VSPU-2014 (Rossiya, Moskva, 16-19 iyunya 2014 g.), IPU RAN, M., 2014, pp. 1126-1134.
[4] J. L. Willems, J.C. Willems. "Feedback stabilizability for stochastic systems with state and control dependent noise", Automatica, 12 (1976), pp. 277-283.
[5] W. M. Wonham. "Optimal stationary control of a linear system with state-dependent noise", SIAM Journal Control, 5:3 (1967), pp. 486-500.
[6] D. L. Kleinman. "Optimal stationary control of a linear system with control-dependent noise", IEEE Transactions on Automatic Control, 14:6 (1969), pp. 673-677.
[7] P.J. McLane. "Optimal stochastic control of linear systems with state- and control-dependent disturbances", IEEE Transactions on Automatic Control, 16:6 (1971), pp. 793-798.
[8] U. G. Haussmann. "Optimal stationary control with state and control dependent noise", SIAM Journal on Control, 9:2 (1971), pp. 184-198.
[9] M. M. Khrustalev. "Conditions of the Nash Equilibrium in Stochastic Differential Games under Incomplete Information on the State: I: Sufficient Equilibrium Conditions", Izv. RAN. Teoriya i sistemy upravleniya, 1995, no.6, pp. 194-208.
[10] M. M. Khrustalev. "Conditions of the Nash Equilibrium in Stochastic Differential Games under Incomplete Information on the State: II: Lagrange Method", Izv. RAN. Teoriya i sistemy upravleniya, 1996, no.1, pp. 72-79.
[11] S. V. Lutmanov. Linear optimization problem. Vol. 2: Optimal control of linear dynamic objects, Permskiy gosudarstvennyy universitet, Perm', 2005, 195 p.
© M. M. Khrustalev, E. E. Onegin, 2015 © ICS V. A. Trapeznikov of RAS, 2015 © Program systems: Theory and Applications, 2015
[12] M. M. Khrustalev, D.S. Rumyantsev, K. A. Tsar'kov. "An algorithm for synthesis of the suboptimal control law for quasi-linear stochastic dynamical systems", Journal of Computer and ¡Systems ¡Sciences International, 53:1 (2014), pp. 71-83.
Sample citation of this publication:
Mikhail Khrustalev, Evgeny Onegin. "Analytical design of controllers for quasi-linear systems on the infinite time interval", Program, systems: theory and applications, 2015, 6:2(25), pp. 29—44. (In Russian.)
URL http://psta.psiras.ru/read/psta2015_2_29-44.pdf