НАУКА и ОБРАЗОВАНИЕ
Эл JVs ФС 77 - 48211. Государственная регистрации №0421200025. ISSN 1994-0408
электронный научно-технический журнал
Синтез управления в стохастических системах методом обобщенного
полиномиального хаоса
# 05, май 2012
DOI: 10.7463/0512.0410536
Пупков К. А., Фам С. Ф.
УДК 681.06
Россия, МГТУ им. Н.Э. Баумана [email protected] [email protected]
Введение
Метод на основе обобщенного полиномиального хаоса (ОПХ) [1-3], обеспечивает анализ и синтез динамической системы при наличии неопределенности (начальные условия, параметры, структура и воздействия окружающей среды). Полученное решение использует средние значения параметров системы с вероятностной неопределенностью. Предполагается, что функция плотности вероятности значений этих параметров известна.
При решении задачи синтеза и анализа стохастических динамических систем на основе ОПХ скорость сходимости и точность решения зависят от числа членов разложения. Метод ОПХ имеет преимущество перед классическими методами (метод Монте-Карло, H™ и другие).
1 Постановка задачи
Рассмотрим задачу синтеза оптимального управления в стохастических линейных системах [3-5]. Модель системы имеет вид X (4, t) = A(4) x(4, t) + B(4)u (4, t), (1)
где х(4,г) е Я", и(4,г) е Ят, Л(4) е Я" *", Б(4) е Я"*т;
Л©= [А^)], Б©= [Б^)]
- матрицы с параметрическом неопределенностью; - вектор состояния системы;
- вектор управления; ^ - вектор случайных процессов (СП).
Ставится задачу синтеза управления стохастической динамической системой: найти закон управления с обратной связью в виде
и (4, г) = - кх(4, г), (2)
чтобы минимизировать целевой функционал
3 = $п \ К X (4, г )0х(4, г) + ит (4, г) Яи (4, г)) Лг
р(4)Л4. (3)
2 Решение задачи
Для решения задачи используется расширение полиномиального хаоса Винера-Аски [2,3], являющееся обобщением расширения оригинального винеровского хаоса, но с использованием полного ОПХ.
Каждый компонент состояния системы {Xi (4)}г=1 будет множеством ортогональных СП, представленных в виде
ад
X (4, г) = 2 X (г ф(4). (4)
г=0
Каждая функция базиса ф ОПХ формирует ортогональный базис и означает среднее
{Фг,Ф) = {Фф) 8ц , (5)
где 81 - функция Кронекера, оператор {•*) - среднее взвешенное произведение.
Для СП среднее взвешенное произведение (•*) на гильбертовом пространстве определяется выражением
ф(4),ф (4)} = ]ф(4)ф (4)Р(4) ^ = Еф(4ф (4) ], (6)
где р(4) - весовая функция - функция плотности вероятности СП 4,
связанная с отдельной выборкой из ОПХ Винера-Аски, Е[*] - оператор математического ожидания, взятый по отношению к функции плотности вероятности соответствующего полиномиального базиса. Тогда среднее произведение ортогонального полинома базисных функций равно
Ефф ] = Еф2 .
Выборка базисных функций по схеме Винера-Аски зависит от распределения вероятности.
Каждый тип полинома из схемы Винера-Аски формирует комплексный базис в гильбертовом пространстве. В таблице 1 показаны некоторые общие распределения вероятностей и их связь с полиномиальным базисом в схеме Винера-Аски.
С помощью ОПХ [1-3] процессы и матрицы
А(4) = [ А, (4) ], в (4) = [ в (4) ] можно переписать в виде
&,4) = Ц)фк(4) = хТ(t)Ф(4), X ^) = [хг^),...,х,р(t),
к=0
&,4) = 1>а($)фк(4) = иТ(t)Ф(4), Щ ($) = [ы^),...,Ыир(t),
к=0
А4=11а„,к фк4=аТ ф (а =[ а„.0'...' а„.р]Т >
к=0 (7)
в,(4) = Iъифк(4) = ЬТф(4). Ь = [V..,Ь,р]Т.
к=0
где {ф0 (4),...,Фр(4)}- базисные функции, зависящие от вида СП £ (табл. 1); коэффициенты а, ,к и ь , ,к получены методом проекцией Галеркина [3, 4] на
х
{фк}
р ■
кЯ=0 '
_ A (°,ф (Q Bа фкр)
а,'л _ ф (О)2) , j _ фа1) (8)
Обозначим
-|T
X„ е R"(p«> _ [xT,...,xTJ , U„ е R-<'«> _ [u,T,...,«IJ ,
A„ е R
n(p+1) *n( p+1) _
Aj
_Z aф (а i>j _ 1>n; k _ p>
к _0
p
Bx е Rn(p+1)*-(p+1) _ [B,] _ Xblhkфк(О i _ 1,n; l _ 1,rn; k _ 0,p.
к _0
Закон управления в форме обратной связи зависит от плотнсти вероятности СП и состояния системы (2) вида [1, 5]:
(tЖ (О) _ lLkjXjk (,)Фк (О). (9)
к _0 j _1 к _0
Закон управления является стохастическим из-за стохастической
траектории состояния и входит в целевую функцию E[UL,RuUext
Минимум целевой функций достигается с помощью оптимального управления
U*xt _-R;lBTextPXext _(k®Ip)xex,, (10)
где ® - произведение Кронекера.
Если управление оптимально, то целевой функционал принимает минимальное значение. Матрица К должна удовлетворять решению уравнения Риккати
AIP + PAext + (KT ® Ip)BlP + PBext (KT ® Ip)_ 0.
В результате выбора структуры управления с обратной связью по состоянию получаем модель системы вида
Xext (t) _ AextXext (t) + BeUext (t) _ [ Aex, + Bext (K ® Ip )] X^,. (11)
Таким образом, мы преобразуем модель вида (1) с неопределенными параметрами в модель (11) с расширенной размерностью.
Таблица 1.
Связь ОПХ и типов случайного процесса £
Случайный процесс £ опх Ф(4)
Гауссова Эрмит
Равномерная Лежандр
гамма Лагерр
бета Якоби
пуассона Шарлье
3 Пример
Применим метод ОПХ для решения задачи синтеза оптимального управления стохастической системой вида
Л"! — X 2,
X — Х-1
^ + ^(4)(1 - X2)х2 + и , (12)
где ^(4) - СП с однородным распределением в области [-1,1]. Базисными функциями являются полиномы Лежандра (см. табл. 1).
Для этого примера возьмем порядок полинома Лежандра р=4:
ф — 1, Ф — 4, ф —1(342 -1), Фз —1(542 - 34), Ф4 —1(3543 - 3042 + 3).
2 2 8
Выполним ОПХ разложение х1(4,1), х2(4, ^), . Система (12)
после ОПХ разложения приобретает вид
Х1,т Х2,т,
р р р р р р Л (13)
Х2,т Х1,т +' "" ................' "
1 | р р р р р р и—Г\\ ИЪ,¿т АЛ/ ук1т + \ и, Фт /
\Гт , тщ/ V 7—0 ,—0 /—0 ,—0 к—0 ¿—0 ^
где ¡Чт — фф, Ф — I Ф(4)Ф, (4)Фт (4)Р(4У4,
1уыт — фф ,Фк ,Ф/ ,Фт) — I Ф(4)Ф, (4)ф (4)Фт (4Р(4У4 .
Приведем численный пример. Для системы (12) заданы начальные условия х1(0)=3, х2(0)=0.
На рис. 1, 2 показаны результаты моделирования с помощью метода ОПХ и методом Монте-Карло. Красные линии - результаты, полученные методом ОПХ, зеленые - результаты, полученные методом Монте-Карло.
Рисунок 1 - Средние значения траектории состояния системы
Рисунок 2 - Оценки дисперсии траектории состояния системы
Результаты показывают, что оценки средних значений и оценки дисперсий, полученные ОПХ и метод Монте-Карло достаточно близки.
Заключение
Предложен метод разложения ОПХ позволяет анализировать линейные и нелинейные стохастические дифференциальные уравнения как детерминированные. Другие основные результаты представленного
метода включают в себя возможность решить задачи оптимального стохастического управления в виде детерминированной задачи.
Данный метод можно применять в задаче синтеза систем оптимального управления, а также в задаче идентификации нелинейных стохастических динамических объектов.
Литература
1. Beckmann P., Orthogonal Polynomials for Engineers and Physicists / P. Beckmann. - Golem Press, 1973, 280 p.
2. Datta K.B., Orthogonal Functions in Systems and Control / K.B Datta, B. M. Mohan. - World Scientific Press, 1995, 288 p.
3. Polyak B.T., Probabilistic robust design with linear quadratic regulators / B.T. Polyak and R. Tempo, - Systems and Control, 2001, V. 43, p. 343-353.
4. Sun J., Stochastic Dynamics and Control / J. Sun - Science Press, 2006, 417 p.
5. Пупков К.А. Методы робастного и адаптивного управления / К.А. Пупков - М.: Изд-во МГТУ им. Н.Э. Баумана, 2001.-744 с.
SCIENTIFIC PERIODICAL OF THE BAUMAN MSTÜ
SCIENCE and EDUCATION
EL JV® FS 77 - 4821 1. №0421200025. ISSN 1994-0408 electronic scientific and technical journal
Synthesis of control in stochastic systems by generalized
polynomial chaos
# 05, May 2012
DOI: 10.7463/0512.0410536
Pupkov K.A., Pham Xuan Phang
Russia, Bauman Moscow State Technical University
[email protected] [email protected]
One of the main difficulties of analysis and synthesis of control in stochastic systems is the need of operation in multi-dimensional abstract spaces which are typically infinite-dimensional and difficult to interpret physically. A method was proposed to solve the problem of synthesis of control in stochastic systems using generalized polynomial chaos. The method allows to transform the original problem with a stochastic model into a problem with a deterministic model of high-dimensional state space of a dynamical system. This problem can be solved by known numerical methods.
Publications with keywords: generalized polynomial chaos, analysis and synthesis of control systems, stochastic dynamic object
Publications with words: generalized polynomial chaos, analysis and synthesis of control systems, stochastic dynamic object
References
1. Beckmann P. Orthogonal Polynomials for Engineers and Physicists. Golem Press, 1973. 280 p.
2. Datta K.B., Mohan B.M. Orthogonal Functions in Systems and Control. World Scientific Press, 1995. 288 p.
3. Polyak B.T., Tempo R. Probabilistic robust design with linear quadratic regulators. Systems and Control, 2001, vol. 43, pp. 343-353.
4. Sun J. Stochastic Dynamics and Control . Science Press, 2006, 417 p.
5. Pupkov K.A. Metody robastnogo i adaptivnogo upravleniia [Methods of robust and adaptive control]. Moscow, Bauman MSTU Publ., 2001.744 p.