УДК 519.6
МЕТОД ОПТИМАЛЬНОГО УПРАВЛЕНИЯ НЕЛИНЕЙНЫМИ СИСТЕМАМИ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ
С.М. Лобанов
В статье приведены теоремы существования решений общей задачи оптимального управления нелинейными системами по квадратичному критерию. Показано, что решение этой задачи основывается на законе управления с обратной связью. Рассмотрены приложения полученных результатов к решению задач управления нелинейными системами с различными видами ограничений
Ключевые слова: нелинейная система, закон управления с обратной связью
Существующие методы синтеза
оптимальных замкнутых нелинейных систем управления не дают достаточного эффекта из-за трудностей учета особенностей динамического поведения (математического описания) объектов из различных предметных областей. Проблема синтеза оптимальных нелинейных замкнутых систем является по-прежнему не до конца решенной и поэтому не теряет своей актуальности.
1. Постановка задачи. Рассмотрим нелинейную динамическую систему, характеризуемую дифференциальным
уравнением
х=/ (:,х,и ) (1)
в котором х=(х\...,хп) - п-мерный
действительный вектор состояния, и=(и1,...,ит) - т-мерный действительный вектор управления, А и В -действительные (п х п) - и (п х т)-матрицы, а /=(/1,...,/п) - векторная функция,
определенная и непрерывная вместе со своими частными производными
э Г
ij=i,...,n
Г
auJ
i=i,...,n,
-)i +n+m
7=1,...,т
в пространстве Я1
Предположим, что начальное состояние системы
х(г0) = с (2)
задано, а задача управления системой (1) заключается в минимизации функционала
1 Т п
,/(и) =— Д с(), 0(:) в(() + и(:), Я(:) и(:)^ \к+
+-e(T,Pe(T}
(З)
где Т - фиксированное конечное время,
0(:) и Р — симметрические положительно полуопределенные (п х п) -матрицы, К(0 -симметрические положительно определен-
Лобанов Сергей Михайлович - ТГТУ, канд. техн. наук, доцент, e-mail: [email protected]
ная (m x m)-матрица и e(t) системы, т.е.
ошибка
в(t )=х(:)-1(:) для всех значений :0 < : < Т, где 2=(21,...,2п) — п-мерный действительный вектор,
характеризующий заданный режим
функционирования системы (1).
В общем случае для получения оценок решения (или собственно решения) задачи (1) — (3) применяют различные методы, которые в той или иной форме используют линеаризацию и (или) последовательные приближения [2— 4].
2. Метод последовательных
приближений. Следуя [3], обозначим через ил{:),хл{:) - некоторое Л-е приближение к оптимальному управлению и состоянию соответственно в задаче (1)-(3). Тогда (Л+1)-е приближение идт+1(:),Хдг+1(:) может быть получено как решение вспомогательной задачи о минимизации функционала
1 Т
=2 К с:),0(:)в(:)) +{и(:),ти(ф:+
+-e(T),P e(T))
(4)
с ограничением
x =f(xN, un)+AN(t)(x-xN)+BN(t)(u-uN),
x(to)=c, (5)
в котором ANt) и BN(t) - действительные (n x n) -и (n x m) -матрицы,задаваемые равенствами
A N (t)
_ э/г
dx1
B N (t)
_ Э/ '■
auj
x= xN (t) u=uN(t)
: xn (t) u N (t)
(б)
(7)
Задача (4)-(7) представляет собой вариант задачи слежения для линейной системы и ее решение, как известно, дается законом управления с обратной связью илт+1(:)=К 1(:)В'л?(:)[йлг+1(:)-АГлг+1(:)хлг+1(:)], (8) в котором Кл+1(:) - симметрическое
положительно определённое при :0 < : < Т
o
и
Э x
o
x
u
решение матричного дифференциального уравнения Риккати
К№-1 (0 = - К№+1 (?)АN (?) - А№ (?)К№+1 (?) +
+ К№+1 (/)Б№ (?)К-‘ (/)Б-№ №+1 (?) - 0(0
(9)
с граничным условием
К№+1(Г ) = Р (10)
а /№+і(?) - решение линейного
дифференциального уравнения
/N+1 (?) = -[А№ (?) - Б№ (/)Я-1(/)Б'№ ©К^©/- (?) -
- 0(?>(?)+ (11)
+К№+1 (?) [/(%(?),%(?)) - А№(?)*№(?) - Б№(?)%(?)]
с граничным условием
hN+l(T)=Pz(7)
(12)
(см., например, [1, с. 699]).
Если построенные выше
последовательности
ХЬХ2,...,ХЫ,... (13)
и
и],и2,... ,ил,... (14)
равностепенно непрерывны и равномерно ограничены на отрезке [:0,Т], то из (15) и
(16) можно выбрать подпоследовательности
xN1,xN2, ■■■ ,хЛк ■■■ (15)
ильиш ■■■,ит ■■■ (16)
равномерно на [:0, Т] сходящиеся к некоторым
непрерывным функциям х*(:) и М*(:)
соответственно, где
Иш Лк = ¥. к——¥
Тогда, если окажется, что последовательность (15) совпадает с последовательностью (13), а последовательность (16) - с последовательностью (14), то, используя соотношения (6)—(12), можно рассмотреть и вопрос о том, будет ли и*(:) оптимальным управлением в задаче (1)-(3).
Заметим теперь, что показать эквивалентность последовательностей (15), (17) и (16), (18) в общем случае проблематично. Поэтому в работе [4] была предложена вспомогательная задача, учитывающая конкретные особенности задачи (1)-(3).
Следуя [3], для всех значений N=0,1,2,... рассмотрим вспомогательную задачу о минимизации функционала
•л+М=1К СООМО) +{и(0,Я(0и(0)к:+
2:
с ограничением
+±( е(Т),Ре(Ц
(17)
х ы№)+А(?)(х-х№)+Б(?)(и-и№),
х(?о)=с, (18)
в котором А(?) и Б(?) - действительные (пх п) - и (п х т) -матрицы,задаваемые
равенствами А? )= Э/
дх1
ди:
(19)
(20)
Х = г (?) и=0
Для заданных функций х№ и и№ оптимальное управление и№+1(?) в задаче (17)-
(18) дается законом управления с обратной связью
и№+1(?)=Я-1(?)Б'(?) [Й№+і(?)-К(?)Х№+1(?)], (21)
в котором х№+1(?) - решение уравнения (18), соответствующее и№+1(?) и удовлетворяющее начальному условию
К(?) -решение матричного дифференциального уравнения Риккати К (?)=-К(?)А(?)-А'(?)К(?)+
+К(?)Б(?)Я-1 (?)Б '(?)К(?)-0(?)(22) с граничным условием
К(Т)=Р, (23)
а /№+і(?) - решение линейного
дифференциального уравнения
/г №+1(?) =-[А(?)-Б(?)Я-1(?)Б '(?)К(?)] %№+1(?)-
(24)
-0№(:) +К(:у(хл(:), иД:))
с граничным условием
кл+!(Т)=Рг(Т). (25)
Таким образом, если начальное
приближение х0(:),и0(:) задано, то соотношения (21)—(25) определяют схему
последовательных приближений, которая, как будет показано ниже, при всех
достаточно малых значениях Т позволяет установить существование решений задачи (1)-(3) и дает эффективную процедуру построения этих решений. Отметим также, что для простоты начальное приближение здесь будет определено соотношениями хо(:)=с
м0(:)=К-1(:)В '(:)[^(Т)-К(:)с] (26)
3. Сходимость метода последовательных приближений. Пусть Ь2 - множество функций,
определенных на отрезке [:0 ,Т ], принимающих значения в пространстве Ят и суммируемых с квадратом по Лебегу на [:0,Т]. Далее, пусть ЬТ2 -часть множества Ь2, причем такая, что для каждой функции и е ЬТ2 уравнение (1) имеет абсолютно непрерывное решение x(t), определенное для всех значений :о £: £ Т и
о
удовлетворяющее начальному условию (2). Тогда имеет место следующая теорема.
Теорема1. Пусть функция / = (/1 ,...,/п)
определенна и непрерывна вместе со своими частными производными
Э // .. . Э // . л . л
——, /,7=1,.,п и ——, /=1,.,п, 7=1,...,т
Эх1 Эи1
в пространстве Я1+п+т . Тогда для каждой точки (:0 ,с) пространства Яп+1 найдется такое
действительное число Т0 > :0, что для всех значений :0 < Т < Т0 справедливы равенства 1/т ил(:) = и*(:) и 1/т хл(:) = х*(:),
где сходимость равномерна на отрезке [:0,Т], и*(:)- некоторая функция, определенная и
непрерывная на [:0 ,Т ], а х* (:) -
соответствующее решение уравнения (1) с начальным условием *
х (:о) = с.
При этом оказывается, что для всех значений
:о £: £ т
и(:) Я-1 (:)В'(:) [И*(:)-К(:)х*(:)], где И (:) - решение дифференциального
уравнения
И *(:)=-[А(:)-В(:)Я-1(:)В'(:)К(:)] %*(:)-
* ч * .■
-0({)2(:)+К(:)/(:,х (:),и (:))-А(:)х (:)-В(:)и*(:)] с граничным условием
A*(T)=Pz(T).
Более того, для каждой функции и е ЬТ2 1/т (ил) = • (и ) £ 1/т (и).
N —¥ N —¥
Доказательство теоремы 1 фактически содержится в работах [4, 5] и, потому здесь опускается. Отметим только, что оно осуществляется методом сжатых отображений.
4. Задача стабилизации. Рассмотрим нелинейную динамическую систему, характеризуемую дифференциальным
уравнением
х=Ах+Ви+/ (х,и), в котором х=(х\...,хп) - п-мерный
действительный вектор состояния, и=(и1,...,ит) - т-мерный действительный вектор управления, А и В -действительные (п хп)- и (п х т) -матрицы, а /=(/\...,/п) - векторная функция,
определенная и непрерывная вместе со своими частными производными
д Г .. л д Г . л
——, /,/=1,.,п и ——, /=1,.,п, 7=1,.,т
дх1 ди1
пп+т
в пространстве к .
Предположим, что начальное состояние х(?о)=с
задано, а задача управления системой заключается в минимизации функционала
1 Т
I (и) = — ^ х(7),0х(?^ + (и(ґ),Ки(ґ)^ ]й?+
2 ?0
+ х(Т ),Рх(Т))
Для получения решения здесь также применяется процедура, аналогичная
упоминавшемусяся выше методу
последовательных приближений и
заключающаяся в создании некоторой специальным образом генерируемой последовательности вспомогательных
линейно-квадратичных задач слежения.
Пусть Ь2 - множество функций,
определенных на отрезке [?0,Т], принимающих значения в пространстве Ят и суммируемых с квадратом по Лебегу на [?0, Т]. Далее, пусть ЬТ2 - часть множества Ь2, такая, что для каждой функции и є уравнение системы имеет абсолютно непрерывное решение х(?), определенное для всех значений ?0 < ? < Ти удовлетворяющее начальному условию х(?0)=с. В этих обозначениях имеет место следующая теорема [6].
Теорема 2. Предположим, что
Г(0,0)=0
= 0
ди
= 0.
(27)
(28)
Тогда найдется такое положительное число с0, что при |с| < с0 задача имеет решение
х*(:),и*(:). Более точно, для всех значений :0 < : < Т
и *(:) =Я-1 В '[И *(:)-К(:)х *(:)], (29)
где И*(:) - решение дифференциального
уравнения
И *(:) =-[А—ВЯ-1В 'К(:)]'И *(:)+
+К(:)/(х*(:),и*(:)) (30)
с граничным условием
И*(Т = о
Доказательство теоремы 2 почти дословно повторяет доказательство теоремы 1 и потому здесь также опускается. Что касается появления условий (27) и (28), то они позволяют искать решение на любом интервале [:0,Т] при
и
х
и
достаточной малости значения с .
В общем случае при решении задачи стабилизации при ограничении (1) и предположении о том, что функция /(х,и) дважды дифференцируема по совокупности
аргументов в окрестности точки справедлива следующая теорема. Теорема 3. Предположим, что /(0,0)=0
(0,0),
и
д2Г
= 0
д2Г
х = 0 и = 0
ди ^ди1.
=0
д2Г
х = 0 и = 0
дх^ди1
=0
х = 0 и = 0
Тогда найдется такое положительное число с0, что при |с| < с0 задача имеет решение
х*(:),и*(:). Более точно, для всех значений :0 < :
< Т
и *(:)=Я-1В '[И *(:)-К(:)х*(:)),
где И *(:) - решение дифференциального
уравнения
И *(:) =-[А—ВЯ-1В 'К(:)] 'И *(:)+
+К(:) [/Х(х *(:), и *(:))+/и(х *(:), и *(:))+
+/Хи(х*(:),и*(:))] с граничным условием
И*(Т) = 0,
где /х=(/Х ,..., Д ), /и=Ги ,.../ ), /хи=Гхи ,.../хи ),
1 п д 2 / ‘
/X ( х, и ) = - 2 -----------------Г-
2 7,к=1 дх 1 дх к
Л. ,1 т д2 Г /и (х,и) =- 2 7
2 7,к=1 ди1 д)ик
„и]ик
2 7,к=1 дх^дик х = т х / * и = т и
а 0і, 1, т/ некоторы точки интервала (0,1).
5. Приложение к некоторым общим задачам управления. В качестве приложения полученных выше результатов за основу возьмем задачу об управлении динамической системой
х = /(?,х,и), (31)
в котором х=(х1,...,хп) - п-мерный
действительный вектор состояния, и=(и1,...,ит) - т-мерный действительный вектор управления, А и В -действительные (пхп)- и (п х т) -матрицы,
а /=(/\...,/п) - векторная функция,
определенная и непрерывная вместе со своими частными производными
д// . . , д// . . . .
——, /,/=1,.,п и ——, /=1,.,п, 7=1,.,т
дх1 ди1
п1+п+т
в пространстве к .
Предположим, что начальное состояние системы
х(?0)=с, (32)
задано, а базовая задача управления системой (31) заключается в минимизации функционала
Т
J (и) = — ^ с(?),0е(?) С?)) + (и(?),Ки(ґ)и(?)^ ]й?+ 2?
+±{ е(Т),Ре(Т)
(33)
где Т - фиксированное конечное время, 0(?) и Р - положительно полуопределенные (пх п) -матрицы, К(?) - положительно определенная (т х т) -матрица и е(?) - ошибка системы, т.е.
е(?) = х(?) - г(?) для всех значений ?0 < ? < Т, где, как и ранее, 2=(гх,..,2п') - п -мерный действительный вектор, характеризующий заданный режим
функционирования системы (31).
Задача управления на любом конечном отрезке времени. Рассмотрим задачу (31)-(33) в случае произвольного числа Т. Для этого разобьем отрезок [?0,Т] на I равных отрезков длиной А и для простоты обозначений положим
?к = ?0 + кА, к=1,.1 и хк-1(?0) = с .
Далее, рассмотрим I локальных задач,
заключающихся в минимизации функционала
Jk (и) =1Т [(ек ®,0®ек (О) + % (0,^0% (?) Ш
*~{ек (?к+1))р+1ек (?к+1)
(34)
с ограничением
^&к = Г(t, хк ,ик ), хк (:к) = хк—1(:к X (35)
где к=0,.,/-1, - начальное состояние на шаге к+1 является конечным на шаге к, Рк -некоторая специальным образом подобранная положительно полуопределенная матрица, а при :к < : < :*+1
вк (:) = Хк (:)—*(:) при этом считается, что
Р = Р.
Если значение I достаточно велико (соответственно, значение А достаточно мало), то согласно теореме 1 оценка решения ик каждой из локальных задач (34), (35) дается соотношением
х =0 х
и = 0 и
х = 1 х
*
и =1 и
к
и
ик (:) = Я—1 (: )В'(: )[кк (:) — Кк (:) хк (:)], (36)
где Хк(:) - соответствующее решение уравнения (35), Кк(:)- решение матричного
дифференциального уравнения Риккати
Кк (:) = —К (: )А(:) — А'(:)Кк (:) + (37)
+Кк (:)В(:)Я~1(:)В'(:)Кк (:) — 0(:) с граничным условием
Кк (:к+х) = Рк+1 (38)
Ик(:) - решение дифференциального уравнения
Ик (:) =—А(:) —В(:)К—1(:)ВТ(:)Кк (О^ (:)—
—0(:Ж:)+ (39)
+Кк (:)/(:х (:),ик (:))—Ак (ОхО —Вк (:)и(:)]
с граничным условием
/(?к+1) = 0(?к+1) г(?к+1),
(40)
А(?) =
дх1
и Б(?) =
( / Л ди1
х = х0 (?) и = и0 (?)
х = х0 (:)
: и0(:)
Вообще говоря, решение каждой из локальных задач (34), (35) может быть
получено с помощью описанной выше схемы последовательных приближений. Однако, в этом случае вопрос о выборе матриц Рь.рг-1 представляется совсем не тривиальным. Чтобы обойти его, заметим, что для всех достаточно малых значений А > 0 дифференциальные уравнения (35), (37), (39) могут быть заменены разностными. Будем обозначать значения функций (операторов) в точке :к, к=1,.,1-1 символом этой функции (оператора) с индексом к внизу. Тогда, с учетом граничных условий (38), (40) для всех значений к=0,.,/-1 можем записать изменение вектора на шаге
хк+1 = хк + Гк (хк,ик )А (41)
где
ик = Я—'В'к (Ик — Ккхк), (42)
Кк = Рк+1
Рк+1Ак+1 Ак+1Рг
к+1 к+1
+Рк+1Бк+Л+1Бк+1Рк+1
-0
к+1.
А (43)
и
-°к+-12к+1
(а+1 Б+1%+1Бк+1Рк+1)°+
~°+12к+1 +
+1 к+1
_ьРк+1 (/к+1 Схк+1, ик)— —Ак+1хк+1 -Бк+1ик )
А
. (44)
Тогда матрицы Р1,.,Р1-1 могут быть найдены как решение задачи математического программирования, заключающейся в
минимизации функции 1 Ы [,
вк0квк1 +\ ик,Якик)
1(Р1,...,Рг)=1 2 [(ек,0кек)+(ик,Ккик)Ь
2 к=0 +
2 ек+1, Рк+1ек+1) с ограничениями (41)-(44), где
(45)
ек = хк -Л,-Рм
положительно
а матрицы полуопределены.
Если время Т функционирования системы достаточно велико, то, очевидно, главными проблемами при решении задачи (41)-(45) будут ее высокая размерность и ограничение на положительную полуопределенность матриц Р1,.,Р1-1. Однако, если эти проблемы удастся разрешить, то в результате решения этой задачи будут получены матрицы К0,.,Кг-1 и вектора /0,. ,/1-1.
Для всех значений к=0,. ,1-1 и ?к < ? < ?к+1 положим
К (?) = Кк и / (?) = /к .
Тогда закон управления с обратной связью
и(?) = К_1(?)£'(?)[/* (?) - К* (?)х(?)] (46)
является субоптимальным управлением. При этом закон управления (46) следует рассматривать как приближенное продолжение закона (36) на весь отрезок [?0,Т].
Задача со смешанными ограничениями. Усложним задачу (31)-(33), добавив к ней
ограничения
ф(7, х(ї), и?) = 0 (47)
и
Ф(ґ,х(ґ ),и(ґ)) < 0, (48)
где ?0 < ? < Т, а ф иФ - гладкие векторные функции. Тем самым исходная здача стала задачей оптимального управления со
смешанными ограничениями в форме А.Я. Дубовицкого и А.А. Милютина.
Каково бы ни было значение Т, разобьем отрезок [?0,Т] на I равных отрезков длиной А . Сохраняя все принятые выше обозначения, для получения приближения к задаче (31)-(33), (47), (48) рассмотрим I локальных задач, заключающихся в минимизации функционала
1 ?к+1 •4(и)=- 1
2 ?к
(ек(?№)ек (?) + 2 ик (/),щн (?) +^ (ек (?к+1) Рк+1ек (?к+1 ^
И+
(49)
с ограничениями
хк = /(:,хк,ик I хк (:к) = хк—1(:к X (50)
Ф(:,хк (:),ик (:)) = 0 (51)
и
Ф(:,хк (: ),ик (:)) £ 0, (52)
где к=0,.,1-1 и :к < : < :к+1.
Действуя, как и ранее, для получения хорошего приближения к решению каждой из локальных задач (49)-(52) рассмотрим
а
соответствующую
функционала
задачу о минимизации
1 ?к+1 ,
Ік (ик) = - 1 {/к (?),/к (?)) Ш?
2 ?к
(53)
со смешанными ограничениями (50)-(52), где /к (:) = ик (:) — Я-1 (: )Б'(: )(Ик (:) — Кк (:) хк (:)), хк(:) - соответствующее решение уравнения (50), Кк(:) - решение матричного
дифференциального уравнения Риккати
(54)
(55)
Кк (?) = - Кк (-)А(?) - А (?)Кк (?) +
+ Кк (?)Б(?)К“1(?)Б'(?)Кк (?) - 0(?) с граничным условием
Кк (?к+1) = Рк+1, а /к* (?) - решение дифференциального уравнения
/к (?) =-А)-Б^ШОК (/)[ Кк (?) -0(0#) + (56) +Кк (?)[/(?,хк ®,щ (?))- АК (?)-Б?)ик ?] с граничным условием
/(?к+1) = 0(?к+1)2(?к+1). (57)
Считая, что величина А > 0 достаточно мала, заменим дифференциальное уравнение (35) на разностные и в силу (50)-(57) для всех значений к=0,. ,1-1 рассмотрим задачу о минимизации функции
Ік (ик ) = (/к,/к)А с ограничениями
хк+1 = хк + Гк (хк,ик )А,
Фк (хк,ик ) = 0
(58)
(59)
(60)
и
где
Фк(хк,ик) < 0
/к = Кк 1Бк (/к - Ккхк),
Кк = Рк+1 -[- рк+1Ак+1 - Ак+1рк+1 '
'к+1рк+1
- 0к+1]А
(61)
(62)
и
К =°-й2к-+
(63)
(А+ Ок2к-+
—°к+гк+ +Рк+1(/к+1(хк+1,ик+1))—Ак+1хк+1 —Вк+ик+\А Каждая из задач (58)-(63) представляет собой стандартную задачу математического программирования с параметрами и отыскание ее решения, вообще говоря, можно осуществить с помощью соответствующих стандартных процедур. При этом матрицы Р1,.,Р1-1 могут быть найдены как решение задачи математического программирования, заключающейся в минимизации функции
КЪ...® =^+(«к,%к)Мвк+1,Р+1вк+1)] (64)
2\к=0) )
с ограничениями (57)-(63), где, как и ранее ,
ек = хк - 2к
2 к = 2(?к X Л,...Л1
положительно
а матрицы полуопределены.
Задача (58)-(64), очевидно, является задачей гораздо более сложной, нежели задача (41)-
(45). Однако, если проблемы, связанные с отысканием ее решения, удастся разрешить, то в результате будут получены вектора и0,. ,и1_1. Тогда для всех значений к=0,. ,/-1 и ?к < ? < ?к+1 положим
и* (?) = ик . (65)
Соотношение (65) определяет
субоптимальное управление в задаче (31)-(33), (47), (48). Однако, в отличие от соотношения
(46) его практическое использование
сопряжено с большими трудностями, поскольку в силу ограничений (47), (48)
получить закон управления с обратной связью здесь совсем непросто. Ниже рассматривается задача, в которой вследствие упрощения ограничений это удается достаточно просто сделать.
Задача с ограничениями на управление.
Еще раз усложним задачу (31)-(33), добавив к ней ограничение на управление
и (?) < 1, (66)
где ?к < ? < ?к+1.
Каково бы ни было значение Т, разобьем отрезок [?0,Т] на / равных отрезков длиной А . Сохраняя все принятые выше обозначения, для получения приближения к решению задачи (51)-(53), (66) рассмотрим / локальных задач, заключающихся в минимизации функционала
Jk (и) =1 1 [(ек (?Ш?)екф) +(%(?), Н?Ж?)}
(67)
с ограничениями
хк = /(,хк>ик), хк(:к) = хк—1(:к) (68)
и
|% (:)| £ 1, (69)
где к=0,.,1-1 и :к < : < :к+1.
Действуя как и ранее, несложно заметить, что хорошим приближением к решению каждой из локальных задач (67)-(69) является функция ик, построенная по формуле
\/(:), Г (:) < 1,
где
ик (0 1^’(/(?)), '|/(?) > 1, (70)
к
/ (?) = К-1 (? )Б'(? )К (?) - К к (?) хк (?)) л
хк(?) - соответствующее решение уравнения (68), Кк(?) - решение матричного
дифференциального уравнения Риккати
Кк® = -Кк(ґ)Мґ)-А(ґ)Кк(ґ) (71)
+Кк(7)Б(7)К-1(7)Б'(7)Кк(7) - 0C?)
с граничным условием
Кк (?к+1) = Рк+1, (72)
а Кк(?)- решение дифференциального уравнения
/к (?) =-А) -Б(?)К~1 (?)Б(?)Кк (?)],/к (?) - п (73)
-0?М?) +Кк (/х (?),ик (?))-А(?)хк (?) -Б?и (?)]
с граничным условием
К(?к+1) = Q(?k+1) 2(?к+1) (74)
Считая, что величина А > 0 достаточно мала, заменим дифференциальные уравнения (35) на разностные и в силу (70)-(74) для всех значений к = 0, ..., / -1 запишем
хк+1 = хк + /к(хк,ик)А (75)
с ограничениями (45)-(48), где, как и ранее,
ек = хк - 2к, а матрицы Р1,. ,Р/-1 положительно полуопределены.
Задача (75)-(79), очевидно, является задачей более сложной, нежели задача (41)-(45) (хотя и не такой сложной, как (58)-(64)). Однако, если проблемы, связанные с
отысканием ее решения, удастся разрешить, то в результате будут получены матрицы К0,. ,К/-1 и вектора К0,. ,К/-1.
Действуя, как и ранее, для всех значений к=0,.,/-1 и ?к < ? < ?к+1 положим
а &
К (?) = Кк и К (?) = Кк.
Тогда закон управления с обратной связью [/(?,х(?)), I/(?,х(?))| < 1,
u (t) =
sign(f (t, x(t))), f (t, x(t)) > 1,
где
где
uk = f
fk ,
sign(fk),
l/kl < 1, l/kl > 1,
fk = R—4 (hk — K,x, ),
Kk = Pk+1 — [— P^+i Ak+1 — A-k+i^k+i +
]A
+ Pk+1Bk+1R iBk+iPk+i Qk+i
(7б)
(77)
и
hk =Q+1zk+
(7S)
(Am ^l^+A+l^+J Q+lzk+
-QU-lzk+l +p+l(f+l(xk+l’ Mk+l)) Afc+l^k+l Bfc+lMk+llD
Тогда матрицы Pl,...,Pi_l могут быть найдены как решение задачи математического программирования, заключающейся в
минимизации функции
J(P’-P)^(IJ^’Q^ +(Mfc’RfcUfc>Mek+lPk+lek+l>) (79)
Т амбовский государственный технический унив ерситет
THE METOD OF OPTIMAL CONTROL BY NON-LINEAR SYSTEMS VIA QUADRATIC CRITERION S.M. Lobanov
In the article there is adduced the theorem of the existence of solutions of common problem of optimal control by nonlinear systems by a quadratic criterion. There is being shown that the solution of this task is given by the law of control with feedback. Consider applications of the results to problems control by nonlinear systems with various constraints Key words: nonlinear system, the law of the control with a feedback
f (t, x(t)) = R-l (t)B(t)(h * (t) - K* (t)x(t)), является субоптимальным управлением в задаче (3l)-(33), (66).
Литература
1. Атанс, М. П. Фалб Оптимальное управление. -М.: Машиностроение, l968. - 764 с.
2. Ли, Л.Р. Л. Маркус. Введение в теорию оптимального управления - М.: Наука, l972. - 574 с.
3. Беллман, Р. Процессы регулирования с адаптацией- М.: Наука, l964. - 359 с.
4. Afanas'ev A.P., S.M. Dzyuba, S.M. Lobanov, A.V. Tyutyunnik Successive approximation and suboptimal control of systems with separeted linear part . Appl. Comp. Math. -2003. - V. 2, №l. - P. 48-56.
5. Afanas'ev A.P., Dzyuba, S.M. Lobanov, A.V. Tyutyunnik On a suboptimal control of nonlinear systems via quadratic criteria . Appl. Comp. Math. - 2004. - V. 3, №2. -P. l58-l69.
6. Афанасьев, А.П., Дзюба С.М. Лобанов С.М. Об оптимальном управлении нелинейными системами по квадратичному критерию. Задача стабилизации . Труды ИСА РАН. - 2009. - Т. 46. - С. 98-ll0.