ВестникВГУИТ, № 3, омо
УДК 519.6
Доцент С.М. Лобанов, соискатель В.В. Затылкин, аспирант О. Ш. Малонга
(Тамбов. гос. техн. ун-т) кафедра информационных систем и защиты информации, моб. 8-910-750-13-63
Построение оптимального управления одним классом нелинейных систем по квадратичному критерию
Приведена теорема существования решений общей задачи оптимального управления для одного класса нелинейных систем. Показано, что решение этой задачи дается законом управления с обратной связью. Определена оценка временной границы существования решения.
In the article there is adduced the theorem of the existence of solutions of common problem of optimal control on a class of nonlinear systems. There is being shown that the solution of this task is given by the law of control with feedback. There is ascertained the scheme of consecutive approximations that allows to obtain this law.
Ключевые слова: нелинейная система, закон управления с обратной связью.
Рассмотрим управляемую нелинейную динамическую систему, характеризуемую дифференциальным уравнением
х = Лх+Ви+/(х,и), (1)
где х = (х1,..., хп ) - п -мерный действительный вектор состояния; и = (и1,.,ит) - т -мерный действительный вектор управления; Л и В -действительные (пхп) - и (пхт) -матрицы;
/ = (/ /п ) - векторная функция, определенная и непрерывная вместе со своими частными производными:
п/
nx
J
i, J = 1,„., n,
nu
, i = 1,...,n, J = 1,...,m,
:,n + m
в пространстве Я
Предположим, что начальное состояние
х(г0) = С (2)
задано, а задача управления системой (1) заключается в минимизации функционала
1Т
з(и)=- | [(в((), е в(())+
2 'о
+{и('), Яи(' )}№ + -(е(Т), Ре(Т )), (3)
© Лобанов С.М., Затылкин В.В., Малонга О.Ш., 2012
где Т - фиксированное конечное время; е и Р
- положительные полуопределенные (пхп) -матрицы; Я - положительно-определенная (тх т)-матрица; е(') - ошибка системы, т.е.
е(') = х(')- г(')
для всех значений '0 <' <Т, где г = (г1,.,zn)
- п - мерный действительный вектор, характеризующий заданный режим функционирования системы (1).
Легко видеть, что непосредственное применение принципа максимума
Л.С. Понтрягина к рассматриваемой задаче приводит к достаточно сложной краевой задаче, если только (1) - (3) не сводится к линейно-квадратичной задаче слежения [1, С. 657]. Однако во многих практических ситуациях режим г(') устроен достаточно плохо и указанное сведение становится невозможным. Если влиянием функции / на систему (1) по к аким-либо причинам можно пренебречь, то задача (1) - (3) оказывается достаточно простой и ее, видимо, можно считать полностью решенной [1, 2]. Кроме того, весьма важным представляется то обстоятельство, что здесь решение удается получить в виде закона управления с обратной связью. Поэтому в общем случае для получения оценок решения задачи (1) - (3) применяют различные методы, которые в той или иной форме используют линеаризацию и последовательные
и
приближения, позволяющие свести задачу к некоторой последовательности линейно-квадратичных задач слежения [3-6].
Заметим, что в работах [7-9] намечено дальнейшее развитие упомянутых выше результатов. Существенным недостатком основной теоремы статей [7-9] является то, что закон управления дается только на некотором достаточно малом промежутке времени. Основной целью настоящей работы является устранение этого недостатка.
Вспомогательные задачи. Прежде всего, опишем первую процедуру построения оценок решения нелинейно-квадратичных задач оптимального управления, фактически лежащую в основе последующих построений.
Следуя [4], для всех значений N = 0,1,2,... рассмотрим вспомогательную задачу о минимизации функционала
1
Т
О
1
(5)
+ {и(г),Яи() ]сН + -{в(Т),Рв(Т)) (4)
с ограничением
Хдг+1 = Ахдг+1 + Вим+1 +/(•%, МдД
XN +1(^0) = С.
Для заданных функций xN и uN оптимальное управление иш 1(г) в задаче (4), (5) дается законом управления с обратной связью
UN+l (г) = ЯЛВЩ+1 (г) - К (?) х^1 (г)], (6) где х^ 1(?) - решение уравнения (5), соответствующее иш 1(?) и удовлетворяющее начальному условию х^ 1(г0) = с; К(?) - решение матричного дифференциального уравнения Риккати
К(0 = -К(0А-А'К( 0 +
+ К (г )ВЯ'1В'К (г)- б с граничным условием
К(Т)= Р,
а кш 1(?) - решение дифференциального уравнения
(7)
(8)
линейного
= -[А-ВЯ'1В'К(0]Ъы+1(0 -
(9)
-0г(г) + К (?)/(XN (?), UN (?)) с граничным условием
hN+l(T) = Pz(T). (10)
Таким образом, если начальное приближение х0(г), и0(?) задано, то соотношения (4)-(10) определяют схему
последовательных приближений, которая, как будет показано ниже, при всех достаточно малых значениях Т позволяет установить существование решений задачи (1) - (3) и дает эффективную процедуру построения этих решений. Отметим также, что для простоты начальное приближение здесь будет определено соотношениями
х0(г)пс (11)
и
и0 (г )пЯЛВ \Рг(Т) - К (г )с].
(12)
Построение закона оптимального управления. Пусть Х(г) и Н(г) - решения линейных матричных дифференциальных уравнений
Х = [А- ВЯ'1В'К(Г)]Х, Х(Г0) = Е
и
Н=л-[ А-ВЯ'1В'К(0]'Н, Н(Т) = Е, где Е - единичная (п* п)-матрица. Тогда при использовании (6) уравнение (5) эквивалентно уравнению
XN+1(г) = X(г)с +1 X(г-г)х
Х[ВЛ_1В^hN+1 (Г) + /(XN (Г),UN (г))] ^ ,
(13)
а уравнение (9) с граничным условием (10) -уравнению
hN+1(г) = Н (г)Рх(Т) +
+1 Н (г - г)(К (г)/(хы (г), им (г))- б2(т))йт. (14)
т
Принимая во внимание (14), перепишем уравнение (13) в следующем эквивалентном виде:
XN+1(г) = X (г )с +
+ | [X(г - г)/(XN (Г), иы (Г)) + ВЯЛВ Н(Г)Р2(Т) +
к
t 1 + | X(г-г)ВЯ В'Н(Г-s)(K(8)/(хм(8),иы(5))-т
Тогда с учетом (6) система (13), (14) может быть представлена в виде
Xn+1(t) = X(t)c + | /Цг, Xn (г), hn (г)) +
г0
Т
+| /2(г, 8, XN (8), hN (8))Ж]4г, (15)
и
I
где
км+-(') = Н (' )И0 +
Т (16)
+| /з(',г,хы(г),кы(г))ёг,
К = Рг(Т),
/1(',г, хм (г), Им (г)) = = X (' - г)[ / (х„(г), Я-В'К(г) --К г ) х^ (г )]) + + ^Я7 Н (г)Рг (Т)],
и
/з(',г, х^ (г), А^ (г)) =
-ь
= Н(' - г)(К(г)/(хн(г),Я^В'^(г) -
N
-К (') хн (г))]- ег(г)),
/2 (г, х^ (5), (5)) = -X(' - г)ВЯ^В' х
х/3(',г, хн (5), кн (5)).
Пусть теперь а - некоторое положительное число. Обозначим через Е -множество точек (', х,К) е Я+2п, для которых выполнены неравенства
'0<*< Т, | х - с |< а, | Л - Л0|< а, (17)
где | х | - евклидова длина вектора х. Так как Е - компактное множество, то найдется такое положительное число М, что для всех значений ',х и Л, удовлетворяющих условиям (17), при '0 <т <Т выполнено неравенство
|/ (', г, х, А)|< М, I = 1,2,3. (18)
Обозначим через О множество всех непрерывных пар (х,А) функций, определенных на отрезке р0,Т], принимающих значения в пространстве Яп и при '0 <' <Т, удовлетворяющих условиям
|х(')-а|<а, |КО-к01<а, (19) т.е. О - множество непрерывных пар (х,А) функций, графики которых лежат в £. При этом будем рассматривать часть множества О, такую, что наряду с неравенствами (19) при (х, Ь) выполнялись бы также неравенства
^(Оа - с |< | Н(')Ао- Ко |< | (20)
| х(')-X(')а |< | К(') -Н(0К>|< | (21)
Тогда в силу неравенств
- а<х(') - Х(')а| + ^Оа - а |
| А(') - К1<| К(') - Н(')К1 +1Н(')А0 - К | из условий (20) и (21) следуют неравенства (19) и, таким образом, принадлежность пары (х,А) к множеству О .
Для всех значений '0 <' <Т положим
<р(г) = (х(г),к(г)) и будем говорить, что р^ОТ, если (х,Л) .
Обозначим через Г оператор, задаваемый правыми частями системы (15), (16). Если число Т достаточно мало, то из принадлежности р к От следует
принадлежность к ^^Т и функции
(22)
Р* = Гр,
где р =(х К ).
В самом деле, для того чтобы функция р, задаваемая соотношением (22), принадлежала к множеству От ,
достаточно, чтобы при
выполнении условия (20) для всех значений '0 <' <Т были выполнены также и неравенства
|х*(')-X (' )а |< | А*(')- Н(')А0|<. Но в силу (15), (16) и (18) имеем
|А (')- Н (')А0|= <М(Т -'0)
т
| /3(',г, х(г), Л(г))
с1г
и
| х (')- X (' )с |=
I [/ (', г, х(г), А(г)) +
+ | /2(',г, 5, х(5), А(5))^5]й?г
< М ((Т - '0) + 1)(Т - '0).
Отсюда следует, что при М((Т - '0) + 1)(Т - '0) < а
(23)
условие, предъявляемое к оператору Г в (22), выполнено.
Для всех значений t0 <:7- и Л? = 0,1,2,... положим
Ы') = (хы('Ж('))
и построим последовательность функций
р0,р1,--;фы,--; (24)
определенных и непрерывных на отрезке ['0,Т] , в силу системы (15), (16), приняв
0
и
<Pn+i=F(Pn, N = 0,1,2,...
(25)
Я, (г) - (с, h0). (26)
Поскольку функция (23) принадлежит к множеству ОТ, то согласно равенству (22) все функции последовательности (24) также принадлежат к ОТ.
Рассмотрим функциональное уравнение
Р = Рр. (27)
Поскольку оператор Я отображает множество ОТ в себя, одна из его итераций является сжатием [10]. Поэтому уравнение (27) имеет на множестве О решение р, которое может быть получено по формуле
р*(0=11тр (0, (28)
n ^да
где сходимость равномерна на отрезке [г0,Т] [10, С. 12].
Но так как по построению К =Рг(Т),
то согласно (26) последовательность (25) удовлетворяет начальным приближениям (1 1)
и (12). Поэтому из равенств (6) и (28) следует
* *
существование функций и (г) и х (г),
построенных по формулам
*
limuN (t) = u (t)
n
lim Xn (t) = x (t),
n ^o
(29)
(30)
где сходимость равномерна на отрезке [t0,T].
*
Поэтому функция x (t) является *
соответствующим u (t) решением уравнения
(1) с начальным условием
*
X (to) = c.
Более того, по построению
*
lim Jn (Un ) = J(u )
n ^o
и
jn(un) <jn(u)
T
для всех u £L^ , откуда и следует, что для
T
каждой функции u £LT
(31)
т.е. и*(г ) - оптимальное управление в задаче (1)-(3).
Результирующая теорема. Согласно равенствам (29) и (30) уравнение (16) переходит в уравнение
■* -1 . . *
к (0 = -[А - ВЯ 1В'К(0] А (0 - (МО +
+К (г)/(х*(г), и*(г))
с граничным условием *
К (Т) = Рг(Т). (32)
Аналогичным образом закон управления (6) - в закон управления
* 1 * * и (г)=Я'1В'[К (г)-К(г)х (г)]. (33)
Предположим, что на
множестве,задаваемом неравенствами г0 < г <Т, г0 < т <Т,
| X(г)с - с \< 2, | Н(г)Л0- М< 2,
функции / и /3 удовлетворяют неравенствам
1 3
\/1(г,т,х,К) \<М, и |/3 (г,г,X,К)\<I ,
а на множестве
г0 < г <Т, г0 < т <Т, г0 < 8 <Т
\ X(г) - с \< |, \ Н(г) - К>\< |
функция /2 неравенству
\/2 (г, 8, х, К) \< I .
Тогда имеет место следующая теорема. Предположим, что число Т удовлетворяет условию
M ((T -10) + 1)(T -10) < 2.
(34)
Тогда задача (1) - (3) имеет решение х (г),и (г). При этом, оказывается, что при г0 <г <Т справедлив закон управления (33).
Таким образом, установленная выше теорема дает решение задачи (1)-(3) в виде закона управления с обратной связью (33). При этом неравенство (34) определяет оценку границы существования такого решения.
lim Jn (Un ) = J(u ) < lim Jn (u),
N^o N^o
и
и
Вестпик<ВТУИТ, № 3,
ЛИТЕРАТУРА
1. Атанс, М. Оптимальное управление [Текст] / М. Атанс, П. Фалб. - М.: Машиностроение, 1968. - 764 с.
2. Ли, Л.Р. Введение в теорию оптимального управления [Текст] / Л.Р. Ли, Л. Маркус. - М.: Наука, 1972. - 574 с.
3. Беллман, Р. Процессы регулирования с адаптацией [Текст] / Р. Беллман. - М.: Наука, 1964. - 359 с.
4. Afanas'ev A.P., S.M. Dzyuba, S.M. Lobanov, A.V. Tyutyunnik Successive approximation and suboptimal control of systems with separeted linear part . Appl. Comp. Math. -2003. - V. 2, №1. - P. 48-56.
5. Afanas'ev A.P., Dzyuba, S.M. Lobanov, A.V. Tyutyunnik On a suboptimal control of nonlinear systems via quadratic criteria . Appl. Comp. Math. - 2004. - V. 3, №2. - P. 158-169.
6. Лобанов, С.М. Субоптимальное управление линейными по управляющим
воздействиям системами по квадратичному критерию [Текст] / С.М. Лобанов // Радиотехника. - 2003. -№ 6. -С. 59-62.
7. Афанасьев, А.П. Об оптимальном управлении нелинейными системами по квадратичному критерию [Текст] / А.П. Афанасьев, С.М. Дзюба // Труды ИСА РАН. -2008. - Т. 32. - С. 49-62.
8. Афанасьев, А.П. Об оптимальном управлении нелинейными системами по квадратичному критерию. Задача стабилизации [Текст] / А.П. Афанасьев, С.М. Дзюба С.М. Лобанов. // Труды ИСА РАН. - 2009. - Т. 46. - С. 98-110.
9. Афанасьев, А.П. Об оптимальном управлении одним классом нелинейных систем по квадратичному критерию [Текст] / А.П. Афанасьев, С.М. Дзюба, А.Н. Пчелинцев, С.М. Лобанов // Вестник ТГТУ. -2010. -Т.16, -№ 2. -С. 361-373.
10. Шварц Л. Анализ. Т. 2.-М.: Мир, 1972.