УДК 517.98
© А.Д. Мижидон, К.А. Мижидон
ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ЛИНЕЙНОЙ СИСТЕМОЙ ПРИ ФАЗОВЫХ И
СМЕШАННЫХ ОГРАНИЧЕНИЯХ1
Статья посвящена построению алгоритмического обеспечения решения задачи управления линейной динамической системой, в которой основной целью управления является удержание системы в фазовых и смешанных ограничениях при заданном детерминированном возмущении при минимуме энергетических затрат.
Ключевые слова: линейная система, оптимальное управление, фазовые ограничения, смешанные ограничения, фундаментальная матрица, матричный ряд.
© A.D. Mizhidon, K.A. Mizhidon
THE PROBLEM OF OPTIMAL CONTROL FOR LINEAR SYSTEM WITH STATE AND MIXED CONSTRAINTS
The article is devoted to the construction of algorithmic support of solution the problem of control for linear dynamic system which main purpose is to keep the system in the state and mixed control-state constraints under deterministic given perturbation with a minimum expenditure of energy.
Keywords: linear system, optimal control, state constraints, mixed constraints, fundamental matrix, matrix series.
Введение
В статье рассматривается задача управления линейной динамической системой, в которой основной целью управления является удержание системы в фазовых и смешанных ограничениях при заданном детерминированном возмущении при минимуме энергетических затрат. Для ее решения рассматривается вспомогательная задача оптимального управления с квадратичным критерием качества, матрицы которого зависят от некоторых весовых коэффициентов, выбор которых в конечном итоге обеспечивает при оптимальном управлении выполнение фазовых ограничений. Предложен подход к построению алгоритмического обеспечения решения задачи, основанный на представлении фундаментальной матрицы системы в виде матричной экспоненты, разложенной в матричный ряд.
1. Постановка задачи
Рассмотрим линейную управляемую систему с постоянными коэффициентами
х = Ax(t) + Bn(t) + f(t), х(0) = х", (1)
где x - n -мерный вектор фазовых координат системы; и - г -мерный вектор управления; А - постоянная (п х п) -матрица; В - постоянная (п х г) -матрица, /(Y) - н -мерный вектор внешних воз-
мущений. Вектор-функция /(Y) является ограниченной при t > О.
Система управляется на временном отрезке 0,T . При этом допустимыми управлениями u(t) являются непрерывно дифференцируемые функции.
Нормальное функционирование системы предполагает выполнение в каждый момент времени t е 0,Т фазовых ограничений
x'(t)QiX(t)< 1, (/' =1,2,..., 5) (2)
и смешанных ограничений
x'(Y)C;x(Y) + x'(t)Pfu(t) + u'(t)Dfu(t) < 1, (j - \,2,...,p), (3)
1 Исследование выполнено при финансовой поддержке РФФИ в рамках научных проектов (№ 12-08-00309 а, № 12-01-00914-а)
где Р. - матрицы размерности (пхг); 0/, ( V - неотрицательно-определенные, симметричные
(пхп) -матрицы; /), - неотрицательно-определенные, симметричные (гхг) -матрицы; штрих ()' -здесь и ниже операция транспонирования. Матрицы Р, С , В таковы, что матрицы G , составлен-
ные из них
С,=
ґ 1 ^ С; -Р1
з 2 ]
-р; /),
42 і 3 )
положительно-определенные матрицы.
Требуется при заданном возмущении f(t) найти управление и"(!). при котором на траекториях системы (1) выполняются в каждый момент времени t е 0,Т фазовые (2) и смешанные ограничения (3) и обеспечивается минимум функционала
./(и) = |и' ,
(4)
где Л - положительно-определенная, симметричная г х г -матрица.
Функционал (4) характеризует энергетические затраты.
Отметим, необходимость рассмотрения поставленной задачи возникла в связи с исследованиями, связанными с разработкой алгоритмического обеспечения решения задач автоматизации проектирования виброзащитных систем [1].
2. Вспомогательная задача
Рассмотрим задачу оптимального управления:
х = Ах(V) + Ви (V) + /(V), х(0) = х°, х(і),/(і)єЕп, и(і) є Ег, ґ є [0,7і],
1 т
J(u(■)) = — ^{х^{а,Р)х + х'Р(Р)и + и'Р(Р)и)Л 2
(5)
• 1П1П.
где <2(а,Р), Р([І) и ІІ([І) - матрицы соответственно размерности (пхп), (пхг) и (гхг), определяемые следующим образом
Я(а,Р) = а\Я\ +<^262 + + + ДС2 + ••• + РрС р,
р(Р) = рр1+ р2р2 +... + рррр, ад=д + дд + р2 а +... + ррг.
Здесь щ> Он Рі > 0 - весовые коэффициенты.
Отметим, что рассматриваемая задача как задача аналитического конструирования оптимального регулятора детально была исследована в [2].
В задаче оптимального управления (5) в силу того, что на управление не наложены ограничения, удается выразить из условия максимума
1
Ву--Р’(Р)х-К(Р)и = 0 ои 2
функции Понтрягина
Н = ц/\Ах + Ви + /(0)-~ х'()(а,Р)х + хР(Р)и + и'Р(Р)и
управление:
й = ВТ1 (Р)
в'¥Лрхр)х
Подставив найденное управление (6) в исходную систему (1) и в сопряженную систему
18
о
ц/ = -А!ц/ + Q(a,/3)x + —P(fi)u, ц/(Т) = 0, объединив их, получим краевую задачу принципа максимума:
х = Ах + BR
В'¥~Р\Р)х 1
+ /(0,
ц/ = -Ац/ + Q(a, Р)х + -P{/3)R~l (А
В'¥-Х-Р\{3)х
х(0) = х°
г(Т) = 0.
(7)
Таким образом, если при некоторых весовых коэффициентах а^/З найдено решение краевой задачи (7), то оптимальное управление и оптимальную фазовую траекторию соответственно можно представить в виде
и ) = R l(/3)
В' у/{а, А 0 - ^Р\Р)х{а, А 0
(8)
х* (а, А 0 = х(а, А 0, где х(а,А0 и У'(а, А Г) решение краевой задачи (7).
В общем случае для решения краевых задач не существует общих методов решения. Наиболее полно исследована краевая задача для систем линейных дифференциальных уравнений (в частности, метод Абрамова), к которым относится система (7). Но тем не менее представляет интерес разработка новых эффективных методов решения линейных краевых задач. В нашем случае интерес определяется не только возможностью эффективного решения с их помощью краевых задач, но и их проблемной ориентированностью на применение при разработке алгоритма решения задачи выбора весовых коэффициентов ос,/3 , обеспечивающих при оптимальном управлении и (а, АО выполнение ограничений (2) и (3) и при этом обеспечивающих минимум функционалу (4).
Рассмотрим краевую задачу
3. Краевая задача
[х = Аих + А12ц/ + /(0, х(0) = х°. ш = А21х + А221[/, Ц/{Т) = 0,
где матрицы Д1, Д2, A, Ai определяются следующим образом
1
12 -1 т>’
Аи = A-—BR Р'(/3),
А12 =BR lB'.
4, =Q(a,P)--^P(p)R l(p)P’(P), A22=-A'+^P(p)R lB'.
Введя обозначения:
А =
А А Л
Ли Л12
У =
х
У,
т=
7(0'
о
(9)
(10)
ч^21 ^22) запишем систему (9) в виде
y = Ay + f(t).
Фундаментальную матрицу F(t,z) однородной системы, соответствующую системе (10), представим в виде блоков
(Fu{t,T) Fu(t,r)']
F(t,r) =
KF2l(t,r) F22(t,r)
Решение задачи Коши системы (10) при начальном условии х(0) = х° и при некотором #//(()) = >//" согласно формуле Коши запишется в виде
х(0 = ^1(^0)х0+^2^°У0 + 1Ри^,т)/(т)с1т,
о
I
¥(0 = Р21^,0)х° +^22(/,0М0 + ^21^,т)/(т)с1т.
о
Используя условие на правом конце у/(Т) = 0, из второго выражения из (11) получим
т
¥{Т) = ^21СТ, 0)х° + ^22 СТ, 0) + ]>21 (Т, т)/(т)с!т = 0 .
0
Отсюда, начальное условие ц/° можем определить в виде
(11)
yy°=-F^{T, 0)
F21(r,0)x° +jF21(r,r)/(r)rfr
(12)
Таким образом, при некоторых весовых коэффициентах а,(3, можем записать решение краевой задачи (9) в виде
x(a,/3,t) = Fu(t,0)x° + jFu(t,T)f(T)dT + Fl2(t, 0)ц/°,
0
t
ц/{а, Д,0 = F2l (t, 0) х° + j>21 {t, r)f(r)dт + i^22 (t, 0) y/°
(13)
где i//° определяется выражением (12).
Для нахождения начального значения ц/° сопряженной переменной согласно (12), а также решения краевой задачи x(a,/3,t) и у/(а, ДI) в соответствии с (13) возникает необходимость вычисления фундаментальной матрицы Fit, т). Для этого воспользуемся представлением фундаментальной матрицы в виде матричной экспоненты F(t, г) = ел(*~т>, которая в свою очередь представима в виде матричного ряда
F(t,r) = е2<‘-т) = E + A(t-T) + ^ A2(t - т)2 +... + ^Ak(t - т)к +.... (14)
Представление фундаментальной матрицы в виде матричного ряда (14) можно использовать для построения алгоритмов вычисления фундаментальной матрицы для любой линейной системы дифференциальных уравнений с постоянными коэффициентами [3].
В соответствии с представлением матрицы А из (14) можем получить соотношения для вычисления блоков матрицы Fit, г) :
~>Sku{t-T)k+l
™-г)-£ + £ № + 1>!
(fc + 1)!
Fnit,T) = Y,
Sn(t~r)K (к + 1)!
РтА,,т),Е+1Щ^1,
ЁЬ (£ + 1)!
(15)
где (ихи)-матрицы S^, Sk2, S2l, S22 определяются рекуррентными соотношениями
(\ (л л Л
о0 о0
V 21 22 J
\
L11 12
^21 ^22 J
к л с1 к
( ^к+1 пк+1 \ ( д с<к Д ^к Д ^к А
°11 °12 _ °llAl +°12^21 ^П^-П +°12^22
о£+1 о£+1 ^к л с<к д vk д с<к д
V 21 22 J V 21 11 22^21 °21^12 ^ °22^22 J
(к = 0,1,2,...). (16)
о
о
Для приближенного вычисления блоков матрицы согласно (16) суммы ряда будем ограни-
чивать конечным числом членов ряда, когда добавление нового члена ряда изменяет каждый элемент частичной суммы меньше, чем на заданную точность.
4. Задача поиска оптимальных весовых коэффициентов
Рассмотрим задачу поиска весовых коэффициентов а > 0, Д* > 0, обеспечивающих выполнение неравенств
х' (а, Д, ^(){х* (а, (3,/) < 1,
< х*' (а,Д,ОС^.х* (а, Р,0 + х*' (а, Р,^Р}и*(а,Р^) + и*' (а, Д, {]В}и (а, Д, 0 < 1, (17)
(/=1,...,5), (7=1,2,...,/?), t е О,Г ,
и доставляющих минимум функции
т
(р(а,Р) = Ли {а,Р, )) = (а, Р^)Ки*(а, Р^)Л , (18)
о
где х*(а.р.!) и и (а.р.!) соответственно оптимальная траектория и оптимальное управление во вспомогательной задаче (5), определяемые при некоторых весовых коэффициентах «,Д соотношениями (8).
Для решения этой задачи предлагается, разбив отрезок 0. 7' точками =0, =Т, рас-
смотреть следующую аппроксимирующую задачу: найти весовые коэффициенты а > 0, Д’ > 0, доставляющие минимум функции (18), на множестве, определяемом неравенствам
а,/Щ* (**,«,£) А
< х*'{а, А4)С/(а,Д ^) + х (а, Д^)Р/(а,Р,1к) + и {а, Д,^)Б]и {а,(3,1 к)< 1, (19)
(/=1,...,4 (У = 1,2
где к = \,2,...,Ы.
Замечание 1. При построении конкретных алгоритмов при вычислении целевой функции (18) возможно представление интеграла в виде простейших кубатурных формул (прямоугольника, трапеций, Симпсона), соответствующих приведенному выше разбиению отрезка 0,Т . Для решения полученной задачи математического программирования разрабатываются специальные проблемноориентированные итерационные процедуры, учитывающие специфику конкретных возмущений / «).
При реализации итерационных процедур возникает необходимость выбора начального приближения на множестве допустимых весовых коэффициентов. Здесь допустимыми весовыми коэффициентами называем коэффициенты а, Д, удовлетворяющие неравенствам (17).
Пусть найдено при некоторых весовых коэффициентах а". Р" решение краевой задачи (7) х(а'. Р".!) и )//(а". Р".1). и в соответствии с (8) решение вспомогательной задачи оптимального управления (5). Если при этом оптимальное управление и" (а", Р" ,1) и оптимальная траектория х*(а°, Д°,0 соответственно удовлетворяют ограничениям (2) и (3), то ос" .0' можно взять в качестве начального приближения. В противном случае рассмотрим следующую задачу выбора весовых коэффициентов, обеспечивающих выполнение неравенств
/=1,2...,(5 + ^ , (20)
где (р,(у) - функция задающая / -е неравенство в (19); у = (а,р).
Пусть при некотором у0 = (а". Р") некоторые из неравенств (19) нарушаются. И при этом выполняется ср^у0) <1 — 3 при / е/ и ^>г(/0)> \-ё при /е ./,где 8 - малое положительное число; /иУ-
множества индексов, при которых соответствующие ограничения выполняются или не выполняются. Очевидно / и•/= 1,2,...(5 + р)М .
Для поиска весовых коэффициентов, обеспечивающих выполнение неравенств (19) строится итерационный процесс попадания в область определяемую неравенствами (19). Не обсуждая деталей, имеющих место при конкретной реализации, приведем процедуру реализации одного шага итерационного процесса.
1. Направление спуска к построим следующим образом
/2 = -]ГЛ^(/), (21)
где V (Р/(у") - градиент функции (р; (у). вычисленный в точке у": А? - неотрицательные числа. Коэффициенты Л/ выберем так, чтобы выполнялись неравенства
V(pt{y°),h =-
= ХЛ v^.(/),v^(/) <о
(22)
leJ
при всех индексах i, при которых нарушаются неравенства (19).
Отметим, что в этом случае направление спуска (21) определяет направление убывания функций в точке у° всех функций, при которых нарушились неравенства (19).
2. Следующую точку итерационной последовательности определим, сделав шаг в направлении вектора h
у1 —у° + ■
При этом шаг х > 0 выберем так, чтобы выполнилось условие max(рг(у1) < max(рг{у0)
leJ leJ
при выполнении условий
<Pi O'0) < 1 ПРИ всех / е / .
5. К вычислению частных производных по весовым коэффициентам от решений краевой задачи
Отметим, что при реализации итерационных процедур возникает необходимость вычисления частных производных по весовым коэффициентам у1 от функций х(у, I) и у/(у. 0 решений краевой задачи (9). В соответствии с представлением (13) решение краевой задачи (9), учитывая, что фундаментальная матрица зависит от выбора весовых коэффициентов, запишем в виде
где
у(г, 0 =
/ =
у(у, 0 = F(y, t, 0)/ + jF(y, t, т)/(т)ёт:
0
(Fn(y,f,T) Fl2(y,t,r) ^
(23)
Р(у,1, т) =
У) (у,^т) Р22(у^,т)у
В силу используемого представления (23) при разработке алгоритмического обеспечения, реализующего процедуру выбора весовых коэффициентов, вычисление частных производных функций у(у, 0 по весовым коэффициентам у1 сводится к нахождению частных производных фундаментальной матрицы /'(;/. /, г) по весовым коэффициентам ;/ .
Для вычисления фундаментальной матрицы выше было использовано ее представление в виде матричного ряда
СО 1
Р(у^т) = еА(^>=Е + ^-Ак(у)((-т)к . (24)
к= 1 л!
IE.J
Ряд (24) является при фиксированных значениях ? и г функциональным матричным рядом переменной у, сходящимся при любом значении у. Продифференцировав по у1 данный ряд, получим матричный ряд, составленный из производных
1
~ ЯЛ ~
^А‘(у)^-(у)Ак
5-0 ду,
\Г)
(25)
Теорема. При фиксированных значениях ? и т функциональный матричный ряд (25) переменной у , составленный из производных ряда (24), равномерно сходится и, следовательно, для частных производных фундаментальной матрицы Ь'(у. /. т) по весовым коэффициентам yi справедливо
ЩМ£) = у±(,_г).
ду, '
к-\ рГл _
^(у) — (у)Ак-°-\у)
,=0 ду,
(26)
Доказательство. Для сходимости матричных рядов достаточно, чтобы сходился ряд, составленный из норм слагаемых [4]. Рассмотрим функциональный ряд переменной у , составленный из норм слагаемых ряда (25)
V"' 1 I
У—к-ц ыМ 1
Имеем
11 I*
—к-7 к\ 1
Таким образом, ряд (27) мажорируется рядом
1 1 к дА , ч
<\(-т\ ду,
(Аг-1)!
~ ?)А ~
Г) — (Г)АМ(У) 5=о 9г,-
(27)
ХИ
ал
ду,
1
Данный ряд является равномерно сходящимся рядом. Действительно, представим его в виде
( и ~ , . ит А
5>-
к=\
Выражение
М
дуі
1 и ~ ц^-1 , ,
А(у)\\ =\і-т\
дА , . дуі
і+£
А(у)
V - т\
т\
1 + 1
А(у)
и - г
гп\
\Мф-т) „
является разложением в ряд экспоненты е" " , который равномерно сходится.
Отсюда следует, что функциональный ряд (27) переменной у мажорируется равномерно сходящимся рядом и, следовательно, сам равномерно сходится. Таким образом, матричный ряд (25), составленный из производных функционального матричного ряда (24), равномерно сходится, что и доказывает справедливость (26). Теорема доказана.
Замечание 2. При разработке алгоритмического обеспечения, реализующего процедуру выбора весовых коэффициентов для приближенного вычисления частных производных функций у(у, 0 по весовым коэффициентам у , используется при нахождении частных производных фундаментальной матрицы /' (;/./. г) по весовым коэффициентам у их представление в виде матричного ряда (26).
Заключение
В работе предложен подход к построению алгоритмического обеспечения решения задачи управления линейной динамической системой, в которой основной целью управления является удержание системы в фазовых и смешанных ограничениях при заданном детерминированном возмущении при минимуме энергетических затрат. Для ее решения предлагается рассмотреть вспомогательную задачу оптимального управления с квадратичным критерием качества, матрицы которого зависят от некото-
к-1
к
к= 1
т
т—\
рых весовых коэффициентов, выбором которых в конечном итоге обеспечивается при оптимальном управлении выполнение фазовых и смешанных ограничений при минимуме исходного критерия качества. Построение алгоритмического обеспечения решения краевой задачи принципа максимума, возникающей при решении вспомогательной задачи, и итерационной процедуры выбора оптимальных весовых коэффициентов, основано на представлении фундаментальной матрицы в виде экспоненты матрицы системы, разложенной в матричный ряд.
Литература
1. Мижидон А.Д., Елтошкина Е.В., Имыхелова М.Б. Типовые задачи автоматизации проектирования и их алгоритмическое обеспечение // Вестник ВСГУТУ. - 2012. - № 4. - С. 6-12.
2. Мижидон А.Д. Об одной задаче аналитического конструирования оптимального регулятора // Автоматика и телемеханика. - 2011. - № 11. - С. 102-116.
3. Квакернаак Х.,Сиван Р. Линейные оптимальные системы управления. - М.: Мир, 1977. - 638 с.
4. Беллман Р. Введение в теорию матриц. - М.: Наука, 1976. - 351 с.
Мижидон Арсалан Дугарович, доктор технических наук, профессор, заведующий кафедрой Восточно-Сибирского государственного университета технологий и управления, тел.: (902-5) 633204. E-mail: [email protected]
Мижидон Клара Арсалановна, аспирант Бурятского государственного университета, тел.: (951-6) 398322. E-mail: [email protected]
Mizhidon Arsalan Dugarovich, doctor of technical sciences, professor, head of applied mathematics department, East-Siberian State University of Technology and Management. E-mail: [email protected]
Mizhidon Klara Arsalanovna, postgraduate student, applied mathematics department, Buryat State University. E-mail: [email protected]