Вычислительные технологии
Том 16, № 5, 2011
Асимптотическое решение одной сингулярно-возмущенной задачи оптимального управления методом интегрального многообразия
А. Ж. Жайнаков1, Б. Ы. Аширбаев2 1 Национальная Академия Наук, Бишкек, Кыргызская, Республика 2Кыргызский государственный технический университет им. И. Раззакова, Бишкек e-mail: [email protected], [email protected]
Предложен приближенный способ определения оптимального управления, основанный на разделении медленных и быстрых координат вектора состояния методом интегрального многообразия, что позволяет вместо исходной системы, имеющей более высокий порядок, ограничиваться рассмотрением "укороченной" системы меньшей размерности.
Ключевые слова: сингулярно-возмущенная задача, интегральное многообразие, гамильтониан, сопряженная система, пограничный слой, быстрые и медленные движения.
Исследуемая задача оптимального управления состоит в следующем: требуется найти г-мерную непрерывную вектор-функцию и(£), доставляющую минимум функционалу
т
(1*х(Т, ¡1) + с*г(Т, ¡1) + \ [ и*Ц)ПиЦ)(И (1)
J (u)
на траекториях системы
где y
¿М
2
y = A(^)y + ВДи, y(0) = yo, (2)
¿1 ¿2 \ / Bi
^ ^ J
- фиксированное число, * — знак транспонирования, d, c
, x G R", z G Rm,
^ > 0
малый параметр, Т > 0 векторы с размерностью п, т, К — положительно определенная постоянная матрица с размерностью т х п, А — (п х п), А2 — (п х т), А3 — (т х п), А4 — (т х т), В — (п х г), В2 — (т х г) — постоянные матрицы. Интеграл в формуле (1) оценивает энергии управляющего воздействия, затрачиваемого в процессе управления.
Предположим, что вещественные части корней матрицы А4 отрицательные. Систему (2) можно переписать в виде
x
A1x + A2z + B1u, x(0) = x0, x G R" ^z = A3x + A4z + B2u, z(0) = z0, z G Rm
Гамильтониан для оптимальной задачи (1), (3) определяется как
Я = i (u, Ru) + (р, Агх + A2z + Вги) + (q, А3х + A^z + В2и), (4)
где векторы р и q являются решениями сопряженной системы
р = —Aip — A3q>
ßq = —a2p - A4q (5)
и удовлетворяют граничным условиям
c
p(T,ß) = -d, q(T,ß) =--. (6)
ß
Условие
должно быть выполнено вдоль оптимальной траектории и означает [1]
dH
— = Ru + B*lP + В* g = 0. (8)
По предположению корпи характеристического уравнения матрицы A4 имеют отрицательные вещественные части. Тогда система (5) имеет пограничный слой и для нее существует интегральное многообразие [2] q = h(ß)p, где h(ß) — m х n-мерная матрица, элементы которой обычно зависят от ß. Матрица h(ß) удовлетворяет матричному уравнению
ßh(Al + A3 h) = A2 + A4h. (9)
Решение уравнения (9) можно построить в виде сходящегося степенного ряда [2]
h(ß) = ho + hiß + h2ß2 + ..., (10)
где
ho = —A4-iA2, hi = A4-iho(Ai + A3ho),...,
hi = A4-i ^hi-iAi + J2 hjA3h-j-i+^ ,..., г = 1, 2,...
Замена [3] q = n + hp приводит систему (5) к виду
р = — (Ai + A3h)p — A3n, p(T, ß) = —d,
c
ßf] =-(Al - ßhA*3)r], r](T,ß) =---hM = ?7o- (И)
ß
Тогда решения системы (11) с начальными условиями (6) записываются как
p(t) = p?(t) + mi(r ), q(t) = h(ß)p(t) + т2(т ), (12)
где p(t) = e-(A1 +A3h)(t-T) (—d + Ap0) — решение системы
p = —(Ai + A3h)pp, p(T,ß) = —d + Apo, (13)
T
Ар0 = J e-M+WW-^Ale-W-W^riods,
—те
T
Ш! = ß/ e—(A3+A3h)(T—^e-—^da, m2 = e—(A—^ —те
Функции mi и m2 удовлетворяют неравенствам
IM < ßCi llnoM , ||Ш2| < C2 Ы1 e?T, (14) t - T
где Ci , C2, £ — const, r =-< 0.
—...........—.....-.................~
образию q = h(ß)p, то n0 = 0, mi = 0, m2 = 0 и, еледовательно, p = p, q = h(ß)p — решение системы (5), траектория которого лежит на этом многообразии.
Таким образом, для произвольной точки (p0, q0) указана такая точка (p0 = p0 + Ap0, qo = h(ß)p0), лежащая на интегральном многообразни q = h(ß)p, что решение системы (5), выходящее из точки (p0,q0) при t = T(т = 0), при т — —то неограниченно приближается к решению p = p, q = h(ß)p, p(T) = p0, лежащему на данном многообразии, С учетом соотношений (12) формула (8) записывается в виде
u(t,ß) = -R-1 ^ßie-^-^V + = Ф(^), (15)
где
B* = B*1 + B*h, B*2 = B*2 + ßB*A3(A4 — ßhA3)—i + O (ß2eör) (0 > 0), ai = ai(ß) = —d + Apo, a2 = — C + ßhd, A* = Ai + A3h, A = A4 — ßhA3. (16) При ß — 0 имеем следующие предельные соотношения:
lim Bi = B0 = Bi — A2A—!B2, lim B2 = B2, lim A0 = A0 = Ai — A2A—!A3,
lim A4 = A4, lim ai = —d + A3A4-^ lim a2 = C. С учетом (15) система (3) примет вид
x = Aix + A2z + x(0,ß) = x0,
ßz = A3X + A4Z + ^2, z(0,ß) = Z0, (17)
где = В1Ф, = В2Ф, Ф(^ ß) — известная функция, определенная формулой (15), В отличие от (5) система (17) имеет интегральное многообразие
z = K (ß)x + w(t,ß), (18)
движение по которому описывается системой
x = (Ai + A2K )x + A3^ + ^i. (19)
Матрица К и вектор ш являются решениями уравнений
цК(Аг +А2К) = А3 +А4К, + ¡лК{А2хи + <рг) = А^ъо + <р2. (20)
Аналогично вышеуказанному уравнения (20) также имеют решения, которые могут быть представлены в виде сходящихся степенных рядов
К = Ко + ^К + ... + ^гаК„ + ...,
= шо(£) + ^ш^) + ... + ^гаш„(£) + ...
Для функций, входящих в правые части системы (17), можно записать конечные асимптотические разложения по степеням коэффициенты которых однозначно определяются из соотношения (20) путем приравнивания их при одинаковых степенях Произведя в системе (17) замену [4]
г = К (^)х + ш(£, + у, (21)
быстрые и медленные движения можно разделить, перейдя к системе
Х = (А + А2К )х + А2Ш + + А2У, х(0, = Хо,
= (А4 - ^КД.)/, у(0^) = го - Кхо - ш(0) = уо. (22)
Аналогично, как это делалось выше для системы (5), решение системы (22) можно записать в форме (12).
Пример. Объект управления описывается уравнением
+(Г,+ £ = *». (23)
Обозначив Х = х2, уравнение (23) запишем в виде системы
з = + А2г + В1и, ^ (0) = зо, Т^г = Азу + Лг, г (0) = го, (24)
где Ах = ^ ] ' А2 = ( 0 )' = ^ 1 ) '
^ = ( ХХ Ь г = х2, 0 < Т1 < Т2 < 1. Требуется найти алгоритм управления и(£),
0 0 \ / 1 ч /0
0 __ = ( 0 ), Аз = ( 0, 1 ), = -1, В, =
Т1 / V Т1
Х2, 0 < Т1 < Т2 < доставляющий минимум функционалу
т
.1 (и) = (¿IX (Т) + (¿2X1 (Т) + Ах2 (т) + \ J и2 (*) ^ (25)
о
на траекториях системы (24), где с, к — постоянные, Т € [0, 1] — время.
В системе (24) введем следующие обозначения:
х = х2 = Ь, XI = -777X1 + ^и = /2, Х2 = 7^X1 - ^х2 =/3. (26)
Т1 Т1 Т2 Т2
Тогда уравнения для сопряженных переменных ф имеют вид [1]
Ф1 = -
ф2 = -
Ф 3 = -
с21±ф1 + с2Аф2 +
дх дх дх
0,
дх1 дх1 дх1
дк , 5/3 . "
- 7^3, Т1 Т2
: + ттг^з-Т2
Систему (27) перепишем как
р = - д = -а2р - А4д
(27)
(28)
где
Р
ф1 ф2
9 = л
Т2
А2
1, 0
А3
00
А4 = -1.
Уравнения системы (28) удовлетворяют граничным условиям
р (Т,Т2) = -
^2
я(Т,Т2) =--г.
Т2
Т2
в виде д = п + кр, где матрица к удовлетворяет уравнению
Т2^А: + Т2^А3^ = А2 + А4к.
(29)
(30)
Введем замену
(31)
Это приводит систему (28) к виду
р= - (А + А3к) р - А3п, Р (Т,Т2) =
с
Т2?) = - (А\ - Т2НА1) п, V (Т,Т2) = -- + м =
Т2
Решения системы (32) записываются как
р (¿) = р (¿) + Ш1 (т) , д (¿) = к (Т2) р (¿) + т2 (т) ,
где р (¿) = е-(А1+Аз^)(4-т) (-^ + Аро) — решение системы
р = - (А + А3)р, р(Т,Т2) = + Аро,
(32)
(33)
(34)
здесь
т
Аро
е
При Т = 0.1, Т2 = 0.5 получаем
т
Лро
0
е2(Т
■ е6(«—т) ■ 15.2^ =
т
15.2 / е
—4Т+4«
0
3.8
т = —Т
гЛ е—(АЗ+А^)(т—а)А3е—(а4—т^з)а^а
-0.5
0
32(т—а)
е3а ■ 15.2^а
—7.6
2т
0
—7.6е6(4—т)
10
Тг - Т1е^~Т) еМ*~Т)
— 1
/
—1 1.8
1
-Т1 + + / ^ -0.1 + 2.3е2(4"т)
р ф = р ф + Ш1 (г) = ^ —01 + 2 3е2(4—т) — 7.6еб(4—т) т2 (т) = е—(а4—т^з)тПо = 15.2е6(4—т),
5 (*) = + т2 (т ) = (0.2, 8) 1 —01 + 23е2(4—т)
= 0.2 — 0.8 + 18.4е2(4—т) + 15.2е6(£ — Г).
1
+ 15.2е6(4—т)
Из условия (8) получим
и = —=
0, --
к
1
т, )\ -0.1 + 2.3е2(*-т) - 7.6е6(*-т) — 1 + 23е2(4—т) — 76е6(4—т).
(35)
(36)
Теперь (24) примет вид
3 = А^ + — (0, Г2) = 3о,
^ = Азу + (0, ТО = (37)
Система (37) имеет интегральное многообразие г = К (Т2) з + ш (¿,Г2), движение по которому описывается системой
3 = (Л + Лк) з + Л2ш — В^Р, где матрицы К и ш являются решениями уравнений
Т2К (А1 + А2К) = Аз + А4К, Г2(Ш + Г2КА2Ш — ТгКВ^р = А4Ш.
(38)
0
т
0
т
Нас интересуют те решения уравнения (38), которые при Т2 ^ 0 стремятся к К = —А-1А3, Произведя в системе (37) замену
г = к (72) в + и (№) + р, (40)
получим систему с разделенными переменными состояния
в = (А + А2К) в + — В^р + А2Р, в (0,72) = во,
Т2Р = (А4 — Т2КА2) р, р (0,Т2) = го — Кво — и (0) = ро. (41)
Решения уравнений (38) и (39) имеют вид
К = (К К2) = (0, 6),
г
а4-т2ка2 г а4-т2ка2 ,
о; (¿, Т2) = е ^ ^ (0) + / е ^ ^ТаХВ^р (5) ^ =
о
= —15 (1 — е-2г) + 172.5 (1 — е-4г) + 285е-2г-6г (1 — е8г) . (42)
С учетом (42) получим решение второго уравнения системы (41)
а4-т2ка2
<Р (к, 72) = е ^ Vо = 7е"24.
Тогда
х (*, Т) = —0.525 + 163.5* — 45.6е-10г + 4е-2г + 43.125е-4г + 285.5е"2г"6г*—
— 36.625 (е-2г-6г — е-8г-2г) — 138е2(г-т)*+ + 13.8 (е2(г-т) — е-8г-2г) — 45.6 (е6(г-т) — е-4г-6г) , Х1 (*,Т) = 1 — 23 (е-2(г-т) — е-8г-2г) + 76(е6(г-т) — е-4г-6г). (43)
Таким образом, оптимальные траектории системы (24), доставляющие минимум функционалу (25), определяются функциями в (43).
Список литературы
[1] Ройтенверг Я.Н. Автоматическое упрвление. М.: Наука, 1978. 552 с.
[2] Иманалиев З.К. Метод интегральных многообразий в линейной сингулярно-возмущенной задаче оптимального управления с квадратичным функционалом // Компьютеры в учебном процессе и современные проблемы математики. Материалы IV Республ. научно-метод. конф. Бишкек, 1996. Ч. 2. С. 19И96.
[3] Стрыгин В.В., Соболев В.А. Разделение движений методом интегральных многообразий. М.: Наука, 1988. 256 с.
[4] Геращенко Е.И., Геращенко С.И. Метод разделения движений и оптимизация нелинейных систем. М.: Наука, 1975. 295 с.
Поступила в редакцию 28 июня 2011 г.