УПРАВЛЯЕМЫЕ СИСТЕМЫ И МЕТОДЫ ОПТИМИЗАЦИИ
УДК 517.97
doi: 10.18101/2304-5728-2016-1-16-26
© А. С. Булдаев, К. А. Мижидон
Задача построения управления линейной динамической системой по эталонному закону движения 1
Рассмотрена задача оптимального управления линейной динамической системой с интегральным критерием качества, характеризующим отклонение закона движения системы от некоторого эталонного закона. Предложен подход к решению задачи, основанный на решении задачи математического программирования на первом промежутке постоянства управления и с одновременным нахождением точки переключения управления. Показано, как найти при этом подходе последующие точки переключения. При этом приведены все необходимые теоретические обоснования предложенного метода решения задачи.
Ключевые слова: оптимальное управление, эталонный закон движения, интегральный критерий качества.
© A. S. Buldaev, K. A. Mizhidon
The problem of construction control for linear dynamical system according to reference law of motion
The article deals with the problem of optimal control for linear dynamical system with an integral quality criterion characterizing law of motion deviation from some reference law. We proposed an approach to solution of the problem based on mathematical programming with control constancy on the first interval and with simultaneous detection of control switching point; and showed the ways to find the subsequent switching points. The theoretical justification of the proposed approach was presented.
Keywords: optimal control, reference law of motion, integral quality criterion.
Введение
Постановка и решение рассмотренной в данной статье задачи построения управления связана с необходимостью решения одной из типовых задач проектирования виброзащитных систем (ВЗС) [1].
:Работа выполнена при финансовой поддержке РФФИ, проекты № 15-01-03680-а, № 15-41 -04020-р_сибирь_а; МОН РФ, проект №3808
При проектировании ВЗС, как правило, задается совокупность требований, предъявляемых к системе виброзащиты, отражаемая в техническом задании.
Требования, предъявляемые к ВЗС при проектировании, являются противоречивыми. С одной стороны, ВЗС должна обеспечивать заданное снижение уровня динамических воздействий до заданного уровня, а с другой - должна иметь ограниченные габаритные размеры. В условиях, когда заданы количественные характеристики этих требований, представляют интерес задачи об оценке предельных возможностей виброзащиты [2], решение которых, не рассматривая вопроса о физической реализуемости, позволяют оценить тот предел, к которому следует стремиться при проектировании системы виброзащиты. К задачам об оценке предельных возможностей можно отнести задачу построения эталонного закона функционирования системы, т.е. такого закона движения объекта защиты, который удовлетворял бы всем требованиям, предъявляемым к функционированию ВЗС [1]. Построению эталонного закона функционирования динамических систем были посвящены работы [3-5]. В этих работах рассматривались задачи управления линейной динамической системой, в которой основной целью управления являлось удержание системы в фазовых ограничениях при заданном внешнем детерминированном возмущении [5], в частности, в [3,4] задача рассматривалась при полигармоническом возмущении. В работе [6] рассматривалась задача оптимального управления линейной системой при фазовых и смешанных ограничениях при минимуме энергетических затрат, которую также можно рассматривать как задачу построения эталонного закона движения. В практике проектирования ВЗС вызывает интерес задача построения управляющих воздействий, формируемых активными элементами виброзащиты, реализующих некоторый эталонный закон движения. Данная задача может быть поставлена, как задача оптимального управления линейной системой.
В рассматриваемой работе предлагается подход к построению управления линейной динамической системой по критерию близости реального закона движения к эталонному закону.
1. Постановка задачи
Рассмотрим линейную управляемую систему с постоянными коэффициентами
х = Ах(г) + Бп(г) + /(г), х(г0) = х0, (1)
где х - п -мерный вектор фазовых координат системы; п - г -мерный вектор управления; А - постоянная (п х п) - матрица; Б - постоянная (п х г) - матрица, /(г) - п -мерный вектор внешних возмущений. Вектор-функция / (г) является непрерывной, ограниченной функцией при любом геТ = [г0, гх].
Система управляется на временном промежутке г еТ. При этом до-
пустимыми управлениями и (V) являются кусочно-непрерывные функции, удовлетворяющие
и(0 е и = {и(0 е КСГТ : |и,(V) < I,, / = 1,2,...,г}, V е Т . (2)
Пусть задан эталонный закон движения хэ (V), удовлетворяющий в момент времени V = t0 начальным условиям хэ (t0) = х°.
Требуется определить допустимое управление и*(V) еи, V еТ , доставляющее минимум функционалу
1 V
1 111 ||2 J(и(•)) = -Г x(t) - хэ (V) dt. (3)
2 о
Здесь под интегралом Ц • Ц - евклидовая норма. Функционал (3) назовем критерием близости реального закона движения к эталонному закону.
2. Обсуждение решения задачи
Задача оптимального управления (1)-(3) является линейно-выпуклой задачей, поэтому принцип максимума Понтрягина является необходимым и достаточным условием оптимальности.
Функция Понтрягина для задачи(1)-(3) имеет вид
т 1 N II2
Н(у,х,и,V) = уТ ^)(Ах({) + Bu(t) + f (V))--|x(t)-хэ(0|| =
=у (t)( ^)+ви,)+/(t)) - 2( ✓ (t) *) - 2 ✓ (t) х-(t)+^ (t) х-(t)),
где у/^) - сопряженная функция.
Запишем исходную систему (1) и сопряженную систему в виде одной системы
Г х = Ах + Ви + / (V),
Г ,т (4)
[у/ = х - А1 у - х (V).
В силу структуры задания множества допустимых управлений (2) максимум функции Понтрягина достигается при кусочно-постоянных управлениях, при этом оптимальное управление определяется следующим образом
4, [В>(0]к > о,
к (к = 1,2,...г), V еТ . -!к, [Вту(1)]к < 0,
Моменты времени, в которых функции [ обращаются в нуль,
соответствуют точкам переключения управления. Отрезок Т разобьем на N частичных интервалов точками переключения управления
Т0 = tо, 71, Т2, ...,TN-1, TN = t1 .
и*(V): и;(V) = <
Будем считать, что на каждом частичном отрезке [ti ,т.+1 ] допустимое управление и (г) является постоянным
п(г) = vi, г е[т. ,тм ], vi еи (. = 0,1,..., N —1) . Таким образом, каждому допустимому управлению и (г) еи, г еТ соответствует набор векторов и(•) о 0,V1,...,, где к -ая компонента
вектора V, (. = 0,1,...,N -1) принимает значение 1к или —1к.
Участки траекторий х(г,V0), х(г,V0,V1),..., х(г,V0,V1,...,vN—1), соответствующие частичным отрезкам вычисляются последовательным решением задачи Коши для системы
х = Ах(г) + Би(г) + / (г)
на каждом интервале разбиения [т..,т.+1 ], (. = 0,1,...,N — 1). При этом для каждого момента т0 = г0, т1, ...,т!^—1 ,т!^ = г1 справедливо х(г0, V0) = х0, х(т1, V0) = х(т1, V0, V1) = х1,...,
,..., хТ—1,V0,V1,...,V-22) = хТ—1,V0,V1,...,vN—1) = х-1,
х(г1, V0, V1,..., vN—1) = x(тN, V0, V1,..., vN—1) = xN.
Введя обозначения:
А =
ГА 0 ^ Е — АТ
У =
/ (г) =
Г Би(г) + / (г)
— хэ (г)
запишем систему (4) в виде
У = Ау + / (г).
Фундаментальную матрицу F(г,т) однородной системы, соответствующей системе (4), представим в виде блоков
F (г,т) =
Гад,т) ад,т)
чад,т) ад,т)
22
Решение задачи Коши системы (4) при начальном условии х(г0) = х0 и при некотором у/(г0) = согласно формуле Коши запишется в виде
0
х(г) = ад, г0) х0 + ад, г0)у0 +
- 12 v ' 0 / г
+1 ((г,т)( Би(т) + / (т)) — Еи(г,т) хэ (т))аТ,
у/(0 = ^>1 (г, О х0 + F22(t, д./ +
г
(5)
+ { (ад ,т)( Би(т) + / (т)) — ад,т) хэ (т))аТ.
Нетрудно показать, что
(г,т) = F(г,т), ад,т) - 0, ад,т) = FT(т,г)
где F (t,т) - фундаментальная матрица однородной системы дифференциальных уравнений х = Ах .
При выборе некоторого набора векторов {у0, V1,..., у^1} участки траекторий х(^V0), х^,V0,V1),..., х(^V0,V1,...,у^1), соответствующие частичным интервалам [т*,т*+1 ], (* = 0,1,...,N -1) согласно формуле Коши соответственно запишутся следующим образом
г
х(1, V0) = F(t, х0 + ГF(t, 5) + /(5))¿5,
*0
x(t,V0,...,Vk) = F(t,tо)х0 +Х {F(тl,т)В + /(т))ёт
+
+Г F(t,5)(BvN-1 + /(5))(к = 1,2,...,N -1).
3. К нахождению точек переключения управления
Пусть все точки переключения т1,т2,...,т; определены. Найдем следующую точку переключения тм. Для этого рассмотрим вспомогательную задачу оптимального управления на временном отрезке [т* ,т*+1 ] х = Ах^) + Ви^) + / (V), х(т.) = х*,
и^): \и[(V) <¡к, (к = 1,2,...,г),
1|| ||2 1 Т*+1 II ||
J(и (•)) = - х(т*+1) - хэ (т^) + - I х(0 - хэ (V)
2
(7)
2
^ тт,
V
где конечный момент времени тм , подлежащий определению, такой, что
оптимальное управление в задаче (7) принимает постоянное значение V'*
на интервале [т* ,т*+1 ], и в момент времени т{+1 по крайней мере одна из
компонент управления меняет знак.
Для задачи (7) краевая задача принципа максимума запишется следующим образом
[ х = Ах + ВV + / (V), x(тi) = х*, [у = х - АТу - хэ (V), у (т+1) = -х(т*+1) + хэ (т*+1). Здесь V - постоянный вектор.
При некотором начальном условии у(т{) = У решение задачи Коши
Г х = Ах + ВV + / (V), х(т*) = х*, 1у/ = х - АТу - хэ(V), у/(т1) = у',
(8)
1=0
2
согласно (5)-(6) запишется в виде (9)-(10)
t
х(0 = Ё (¿,т,) х' +1Ё (¿,т)(Бу' + f (т))dт, (9)
г,
у(г) = Ё^т,) X' - Ёт (т,, г )у' +
г ■ -т (10)
+1 (ё21«,т)(Бу' + /(т) - Ёт (т, Г) хэ (т)^т. У '
В силу условия на правом конце в краевой задаче (8) и представления решения (10) имеем
У(тм) = Ё21(т,+1,т,)X' -Ёт(т,,тм)у' +
> ■ -т (11) + | (Ё21 (т,+1,т)(Бу' + /(т)-Ёт(т,т,+1)хэ(т)Мт = -х(т,+1) + хэ(т,+1). ' '
Используя представление решения (9), подставим х(т ,+1) в (11)
У(тм) = ё21(т,+1,т,)х' - Ёт(т ,,т 1+1)¥' +
+ {(Ё21(т,+1,т)( Бу' + / (т) - Ёт (т,тм) хэ (т))^м) =
г,
= -Ё(т,+1, т '■)X ' - { Ё(т,+1,т )(Бу ' + /(т ))йГ + X3(т<+1).
г.
Отсюда найдем у1
У = (Ёт (т,, т,+1))-1 [ Ё21(т,+1, т '■) х' + Ё ( т ,+1, т,) х ' +
+ |1(Ё21(т1+1, т )(Бу' + /(т) - Ёт (т, т ,+1)х3 (т ))ёт) + (12)
г,
+ { Ё(т,.+1, т )(Бу' + /(т))^ - х3( т,+1) .
т
Таким образом, решения у^) краевой задачи (8) при некотором управлении, принимающем постоянные значения у ', может быть представлено в виде (10), где у' определяется выражением (12).
Отметим, момент времени тм является точкой переключения оптимального управления в задаче (1)-(3), если выполняются условия:
1) На интервале [ т,., т ,.+1) вектор-функция Бту(1), где у(1) определяется выражением
В>(0 = Вт (F2í(t,тi)Х -FT(т (т,^))-1 ^(т^т,)Х + F(тм,тi)Х + + {^(т^В^ / (т)) - Fт (т,тм)хэ (т)^т) +
г,
У- * 1 (13)
+1 F(тl+l,т)Вi* + /(гу$т-хэ(тi+l) +
т
t - ] +|(F2l(t, т)В*+ /(т))-Fт(т,0хэ(т))^ . t0 / не меняет знак. В (13) вектор V1* определяет на интервале [ т {, т+1 ] оптимальное управление и* (0 в задаче (1)-(3).
2) При переходе через точку t = тм, по крайней мере, одна из компонент вектор-функции ) меняет знак на противоположный.
Теорема 1. Вектор V1* - решение задачи математического программирования
X = Лх^) + ВV1 + / ^), x(тi) = х1,
V еV 41 е Ег : IV; |<¡к, (к = 1,2,...,г)},
(14)
1 1 Г
J(V1) = -I|х(т)-хэ( т)||2 + - Л|х(Г)-хэ(t) 22
^ Ш1П,
VеV
будет вектором, определяющим оптимальное управление и*^) в задаче (1)-(3) на интервале [ т^т 1+1 ], где момент тм > т такой, что для вектора
V1* выполняются приведенные выше условия 1) и 2).
Доказательство. Для доказательства достаточно показать, что компоненты решения V1* принимают значения ¡к или -¡к. Используя при некотором постоянном V, представление решения задачи Коши в виде (9), можно задачу (14) свести к задаче минимизации выпуклой квадратичной функции ц>(V1) на параллелепипеде. Для данной задачи необходимым и достаточным условием минимума является выполнение неравенства [7]
), V1 - V1 *) > 0, при любом V1 еи . (15)
В силу структуры допустимого множества и рассматриваемой задачи из (15) следует, что
к • £ (V")> 0,
-¡к, ^ (V) < 0.
ду1
2
Теорема доказана.
4. Алгоритм решения задачи
Процедура решения задачи состоит из следующих этапов. 1. Задав т > t0, находим решение V0* задачи математического программирования
' х = АхЦ) + Ву0 + f (Г), х(^) = х0,
V0 еV = {у0 е Ег : |у0| < 1к, ^ = 1,2,..., г)}, (16)
1 ?
2 1 ГЦ _ II2
2:
11
J(v') = — ||х(т)-хэ(т)|| +—Цх(0 -хэ(0|| М ^тт.
Ч
2. Проверяем на отрезке т] знак вектор функции Вгу(1):
0
В>(0 = Вт (F2l(t, Ц) х0 - FT t)(FT —))-1 ^(т, О х + F (т, ^о)х' +
+ | (Ё21 (г, т )( Ву* + f (т )) - Fт (т , —)хэ (т ))М г) +
(17)
+
+|F(т,т )(Ву0* + f (т ))Мт -хэ(т) t0 _ t - ^ +{ (Ё^, т)(Ву0* + f(т )) - Fт (т , t)хэ (т))Мт .
tо /
Здесь ) определено согласно (13), где т{ = t0, —+1 = т , х' = х0, V 1 = V0*.
Если функция ) не сохраняет знак на т], то решаем задачу
математического программирования (16) с уменьшенным значением т = т - Ат . Задача (16) решается до тех пор, пока не будет найдено значение т , при котором функция ) сохраняет знак на т].
3. Пусть при управлении V0* функция ) сохраняет знак на про-
межутке т ].
а) Примем в (17) т = т + А т .
б) Проверяем знак вектор функции В^у^) на т]. Если сохраняется, то переходим в а). Если не сохраняется, принимаем А т = а— и переходим в а).
Пункты а) и б) повторяются до тех пор, пока не будет найдена первая точка переключения управления т1 = т < t1 и в соответствии с ней опти-
1*
мальный вектор V .
4. Пусть найдена г -ая точка переключения т{ и оптимальный вектор V1*. Для нахождения тм и V+1* применяется аналогичная пунктам а) и б) предыдущего этапа процедура проверки знака вектор-функции Вту(}) на [, т]. При этом вектор-функции ) определяются следующим об-
разом
В>(0 = Вт(т,)хг -Fт(т,,t)(FT(т,, т))-1 [¥а(т,т,)хг + ¥(т,т,)X +
+| (¥21 (т, т)В*+ / (т)) - Fт (т, т)хэ (т))ёт) +
х1
X
+|¥(т, т)(Bv,*+ /{т))йт -хэ(т)
х1
(F2l(t, т)В* + / (т)) - Fт (и)хэ {т))ёт
t0
Заключение
Предложен подход к решению задачи, основанный на решении задачи математического программирования на первом промежутке постоянства управления и с последующим нахождением точек переключения управления. При реализации данного подхода возникает необходимость вычисления фундаментальной матрицы ¥(^ т ). Для этого следует воспользоваться представлением фундаментальной матрицы в виде матричной экспоненты ¥^, т) = еА(1-т), которая в свою очередь представима в виде матричного ряда
¥ т ) = еА(1-т) = Е + А^ - т ) +—А- т )2 +... + — Ак ^ - т )к +.... (18)
2! к!
Для приближенного вычисления блоков матрицы ¥ (^ т ) согласно (18) суммы ряда следует ограничивать конечным числом членов ряда, когда добавление нового члена ряда изменяет каждый элемент частичной суммы меньше, чем на заданную точность.
Литература
1. Мижидон А. Д., Елтошкина Е. В., Имыхелова М. Б. Типовые задачи автоматизации проектирования виброзащитных систем и их алгоритмическое обеспечение // Вестник ВСГУТУ. — 2012. — № 4(39). — С. 6-12.
2. Мижидон А. Д. Об оценке предельных возможностей виброзащитных систем // Автоматика и телемеханика. — 2009. — №4. — С. 149-162.
3. Мижидон А. Д., Мижидон К. А. К построению эталонного закона движения динамических систем // Сборник XII Всероссийского совещания по проблемам управления ВСПУ-14. Институт проблем управления им. Трапезникова РАН. — 2014. — С. 193-199.
4. Мижидон А. Д., Мижидон К. А. Задача удержания системы в фазовых ограничениях при постоянно действующих возмущениях // Обобщенные постановки и решения задач управления. Сборник трудов международного симпозиума. — 2014. — С. 124-128.
5. Мижидон А. Д., Мижидон К. А. Об одном подходе к нахождению управления, обеспечивающего выполнение фазовых ограничений в линейной задаче управления // Автоматика и телемеханика. — 2015. — № 17. — С. 3-17.
6. Мижидон А. Д., Мижидон К. А. Задача оптимального управления линейной системой при фазовых и смешанных ограничениях // Вестник Бурятского государственного университета. — 2013. — №9. — С. 17-24.
7. Сухарев А. Г., Тимохов А. В., Федоров В. В. Курс методов оптимизации. — М.: Наука, 1986. — 328 с.
References
1. Mizhidon A. D., Eltoshkina E. V., Imykhelova M. B. Tipovye zadachi avtomatizatsii proektirovaniya vibrozashchitnykh sistem i ikh algoritmicheskoe obespechenie [Typical Automation Problems of Vibration Isolation Systems Design and Their Algorithmic Support]. Vestnik VSGUTU - Bulletin of ESSUTM. 2012. No. 4 (39). Pp. 6-12.
2. Mizhidon A. D. Ob otsenke predel'nykh vozmozhnostei vibrozashchitnykh sistem [Evaluation of the Limiting Possibilities of Vibration Isolation Systems]. Avtomatika i telemekhanika - Automation and Telecontrol. 2009. No. 4. Pp. 149-162.
3. Mizhidon A. D., Mizhidon K. A. Kpostroeniyu etalonnogo zakona dviz-heniya dinamicheskikh sistem [Construction of Reference Law of Motion for Dynamical Systems]. Proc. 12th All-Rus. Conf. on Control Problems. Moscow: Trapeznikov Institute of Control Problems RAS. 2014. Pp. 193-199.
4. Mizhidon A. D., Mizhidon K. A. Zadacha uderzhaniya sistemy v fazo-vykh ogranicheniyakh pri postoyanno deistvuyushchikh vozmushcheniyakh [The Problem of Keeping System in Phase Constraints under Constantly Acting Perturbations]. Obobshchennye postanovki i resheniya zadach upravleniya. Sbornik trudov mezhdunarodnogo simpoziuma - Generalized Formulations and Solutions of Control Problems. Proc. Int. symp. 2014. Pp. 124-128.
5. Mizhidon A. D., Mizhidon K. A. Ob odnom podkhode k nakhozhdeniyu upravleniya, obespechivayushchego vypolnenie fazovykh ogranichenii v linei-noi zadache upravleniya [The Approach to Control Determination that Ensures Phase Constraints in a Linear Control Problem]. Avtomatika i telemekhanika -Automation and Telecontrol. 2015. No. 17. Pp. 3-17.
6. Mizhidon A. D., Mizhidon K. A. Zadacha optimal'nogo upravleniya li-neinoi sistemoi pri fazovykh i smeshannykh ogranicheniyakh [A Problem of Linear System Optimal Control under Phase and Mixed Constraints]. Vestnik Buryatskogo gosudarstvennogo universiteta - Bulletin of Buryat State University. 2013. No. 9. Pp. 17-24.
7. Sukharev A. G., Timokhov A. V., Fedorov V. V. Kurs metodov optimi-
zatsii [A Course of Optimization Methods]. Moscow: Nauka Publ., 1986. 328 p.
Булдаев Александр Сергеевич, доктор физико-математических наук, профессор кафедры прикладной математики Бурятского государственного университета, e-mail: buldaev@mail.ru.
Мижидон Клара Арсалановна, преподаватель кафедры прикладной математики Восточно-Сибирского государственного университета технологий и управления, e-mail: migka@mail.ru.
Aleksandr S. Buldaev, DSc in Physics and Mathematics, Professor, Department of Applied Mathematics, Buryat State University.
Klara A. Mizhidon, Lecturer, Department of Applied Mathematics, East-Siberian State University of Technology and Management.