УДК 517.977
О ПОСТРОЕНИИ ОПТИМАЛЬНОМ ПРОГРАММЫ ДЛЯ ОДНОГО КЛАССА ГИБРИДНЫХ СИСТЕМ
Канд. физ.-мат. наук ГАБАСОВА О. Р.
Белорусский национальный технический университет
В последние годы гибридные системы встречаются во многих приложениях [1]. Они привлекают внимание многих исследователей. Данная работа примыкает к [2]. В отличие от них в ней поведение непрерывной и дискретной частей гибридной системы рассматривается в непрерывном времени. Получена формула Ко-ши и обоснован метод сведения задачи оптимального управления к задаче линейного программирования.
Постановка задачи. Пусть T = [t*,t*] - промежуток управления, hu = hv/M, hv = (t -t*)N -периоды квантования времени, k, M, N - натуральные числа; M = kN, Tu = {t*,t* + hu, ...,
t* -hu}, T = {t*,t* + hv,..., t* -hv}; Hx e Rmxn', Hy e Rmx"y, rank(Hx, Hy ) = m < n = nx + ny ; g e Rm; u*, u* e Rru; v*, v* e Rr ; cx e Rn, cy e Rny; x0 e Rnx, y0 e Rn ; Ax(t) e R™ , Axy (t) e Rn'xny, Bx(t) e R™, t e T,- кусочно-
непрерывные функции; Ay (t) G R"yx"y, Ay(t) g
g Rny, By (t) g Rnyy"v, t g T, - непрерывные функции.
Рассмотрим задачу оптимального управления
J (u, v) = c'xx(t *) + c'y (t *) ^ max; (1)
\x = AX (t) x + Axy (t) y + BX (t)u;
[y(t) = Ay (t) y(t -hv ) + Ayx (t)x(t) + By (t)v(t), t e T ;
(2)
x (t*) = x0; y (t ) = y0(t ), t e [t* - hv, t*[, y (t*) = y,; (3)
u (t ) eU = {u e Rru : u* < u < u*}, v(t) eV = {v e Rrv : v* < v < v*}, t e T.
(5)
Hxx(t) + Hv (t) = g;
(4)
Здесь x = x(t) e Rn' - состояние непрерывной части системы в момент времени t, у = = y(t) e R" - состояние дискретной части системы, u = u(t) e Rr"; v = v(t) e Rrv - значения управляющих воздействий.
Задачу (1)-(5) будем исследовать в классе дискретных управляющих воздействий u(t), v(t), t eT : u (t) = u (t), t e[x, т + hu [, xeTu; v(t) = = v(t), t e [t, t + hv [, TeTv. Каждой паре управляющих воздействий (u (•) = (u (t), t e T), vQ = = (v(t), t e T)), соответствует единственная траектория (x(t),y(t), t e T), описываемая непрерывной функцией x(t), t eT, и кусочно-непрерывной функцией y(t), t e T. Пару (u (•), v(-)) назовем программой, если на ней выполняются (5) и соответствующая ей траектория системы (2), (3) удовлетворяет ограничениям (4). Программа (u0(-), v0(-)) называется оптимальной, если она доставляет критерию качества (1) максимальное значение.
Формула Коши. Для решения задачи (1)-(5) сначала построим формулу Коши, выражающую зависимость положения (x(t), y(t)) системы (2) от начального состояния (3) и управляющих воздействий (5). Пусть t e T, T(t) = [t*, t], (u(s),v(s)),s e T(t),- управляющие воздействия, (x(s), y(s)), s e T(t), - соответствующая им траектория системы (2) с начальным условием (3). В силу (2) имеет место тождество
(х( 8)^ У( 8)
( Ах (5)х(8) + Аху (8)у(8) + Бх (8)и(8)
ху '
к Ау (8 ) у (8 - И, ) + Аух (5) х( 8) + Б у (8 М 5)
5 е Т (г).
Умножим обе части тождества на пока неопределенную матричную функцию
к а, 8)=
Кх (г, 8) Е Я"^ , Ку (г, 8) Е Я"
Кх (г, 8) Е Я"у Х"', Ку 8) Е Я"
8 Е Т(Г) .
Проинтегрируем (6) в пределах от г* до г.
• +
| Кх (г, 8) ^¿8 + | Ру (}, 8)у(8)Ж = | К (г, 8)[Ах (8)х(8) + Ау (з)у(з) +БХ №(*)№'
и и и
t
+| Рху и, 8)[ Ау ( 8) у(8 - И, ) + Аух (8) х( 8) + Б у (8)у( 8)]08;
t t t
| Кух и, 8) ^¿8 + | Ку и, 8)уШ8 = | Кух (г, 8)[Ах (8)х(8) + Ау (8)у(8) + Бх (8)и(8)№
и "8 и и
t
+| Ку (г, 8)[ Ау (8 ) у( 8 - И, ) + Аух (8) х( 8) + Б у (8)у( 8)] ¿8.
Преобразуем (7), (8), считая функцииКх (г, 8), Кух (г, 8), 8 Е Т(г), дифференцируемыми по 8 .
• +
[ Кх (г, 8) й8 = Кх (г,г)х(г) - Кх(г, г..)х(г.) - [ °Кх(г, 8)х(8^8; 3 ¿8 •* дс
дКх (1, 8)
д8
\ Кух (и 8) ^ ^ = Рух (и 0 х(1) - Кух (I, (.) х(и)-}
г дКх (г,8)
-х(8^8 .
д8
После элементарных преобразований имеем:
t г-И,
| Кху (г, 8) Ау (8)у(8 - И, )ё8 = | Кху (г, 8 + И, ) Ау (8 + И, )у (8^8 = | Ку ^, 8 + И, ) Ау (8 + И, )у^)Л-
и-И,
и-И,
t-И,
(6)
(7)
(8)
(9)
+ | Кху ^, 8 + И„ )Ау (8 + И, )у(8)ё8 = [Ку ^, 8) = 0,8 Е (^ t + И„ )] = | Ку (^ 8 + И„ )Ау (8 + И, ) X (10)
и. и-И,
t
Xу ^)Л + | Кху (и 8 + И,) Ау (8 + И,)у(8
t ^И, и
| Ку ^, 8) Ау (8)у(э - И, У& = | Ку ^, 8 + И, )Ау (8 + И, )у(8)ё8 = | Ку ^, 8 + И, ) Ау (8 + И, )уС0 (э^ +
и и-И, и-И,
г-И,
+ IКу (г, 8 + И, )Ау (8+И,)у(8)й8 = [Ку (г, 8) = 0,8 Е (г, г + И,),Ку (г, г + И,) = 0; уо(8) = (уо(8), 8 е (г* - И,, г.),
х 'у
Л(t*) = Уо)]= J Fy(t,s + hv)Ay(s + hv)y(s)ds + JFy (t,s + hv)Ay(s + hv)y(s)ds.
t*-hv
Подставим (9), (10) в (7), (8) и запишем результат в виде:
Fx(t, t)x(t) = Fx(t, t*)x(t*) - Fxy (t, t)y(t) + J
dF (t v)
—+ Fx (t, s) Ax (s) + Fy (t, s) Ayx (s)
x(s)ds -
+ J[Fx(t, s)Axy (s) - Fy (t, s) + Fy (t, s + hv)Ay (s + hv)]y(s)ds + JFy (t, s + hv)Ay (s + hv)y0(s)ds +
t* t*-hv
t
+ J [Fx (t, s)Bx (s)u(s) + Fy (t, s)By (s)v(s)]ds; (11)
i
J(-F„,(t, s)Ay (s) + Fy (t,s) - Fy (t,s + hv)Ay (s + h, ))y(s)ds = -Fy,(t,t)x(t*) + F„(t,t.)x(t*) +
"J
dFx (t, s)
+ Fyx (t, s) Ax (s) + Fy (t, s) Ayx (s)
+
x(s)ds + J Fy(t,s + hv)Ay(s + hv)y(>(s)ds +
- t,-hv
t
J [Fyx (t, s)Bx (s)u (s) + Fy (t, s)By (s)v(s)]ds .
(12)
Пусть функция (5) удовлетворяет соотношениям
= - Fx (t, s) Ax (s) - Fy (t, s) Ayx (s), s g [t*, t ]; Fx (t, t) = E;
dFx (t, s) ds
F„ (t, s) = Fy (t, s + hv) Ay (s + hv) + Fx (t, s) Ay (s), s g [t*, t ]; Fy (t, s) = 0, s G[t, t + hv ];
(13)
dFxy (t, s)
= - Fy (t, s) Ax (s) - Fy (t, s) Ayx (s), s g [t*, t ]; Fyx (t, t) = 0;
Fy (t, s) = Fy (t, s + hv)Ay (s + hv) + Fyx (t, s)Ay (s) + ES(t, s), s g [t*, t]; Fy (t, s) = 0, s g (t, t + hv); Fy (t, t + hv) = 0,
где5(t,s), s g T(t), - 5-функция Дирака (5(t,s) = 0, если s Ф t). Тогда соотношения (11), (12) примут вид:
t* t x(t) = Fx(t,t*)x(t*) + J Fy(t,s + hv)Ay(s + hv)y0(s)ds + J[Fx(t,s)Bx(s)u(s) +Fxy(t,s)By(s)v(s)ds; (14)
t*.-hv t,
t; t
y(t) = Fyx(t,t*)x(t*) + J Fy(t,s + hv)Ay(s + hv)y0(s)ds + J[Fyx(t,s)Bx(s)u(s) + Fy(t,s)By(s)v(s)]ds.
t*-h, t*
Перейдем к другой, эквивалентной, форме переменной s = t + t* -т и обозначим Ф(^т) = соотношений (13), (14), которая более удобна = F(t,t + t* -т). В новых обозначениях соотно-для вычислений. Сделаем замену независимой шения (13) имеют вид:
дФ х (X, т)
дт
= ФХ(X,т)Лх(X + и -т) + Ф№(X,т)Аух(X + Г* -т),те^*,X];Фх(X,X*) = Е;
Фу (X, т) = Фху (X, т-Ну) Лу (X + X* -т + Ну) + Фх (X, т) Лху (X + X* - т), теТ (X); Фху(X,т) = 0,те^* -Ну,X*];
(15)
= ФУх (X, т) Лх (X + X* -т) + Фу (X, т) Лух (X + X* - т), те[X*, X]; Ф„ (X, X*) = 0;
дФ Ух (X, т) дт
Фу(X,т) = Фу(X,т-Ну)Лу(X + X* -т + Ну) + Фух(X,т)Лху(X + X* -т) + ЕЪ(,X + X* -т),те Т(X);
ух
ху '
(16)
Фу (X, X* - Ну) = 0, Фу (X, т) = 0, те^* - Ну, X*].
Из (16) видно, что значения функции Фу(X,т),теТ(X), в точках цеTц={X*.,X* + Ну,...,
X* + \х*Ну}, ц* = [( -X*)/Ну] содержит импульсную составляющую Ф* (X, ц^^,X* +X -ц). Матричная функция Ф*у (X, ц), цеТц, удовлетворяет
уравнению
Ф*у (X, ц) = Ф* (X, ц-Ну)Лу (X + X* - ц + Ну), цеТц; Фу(X, X*) = Е.
(17)
Сужение функции Фу (X, т), X е Т(X), на множество Т \ Тц обозначим через Ф^ (X, т), те е Т \ Тц. Оно удовлетворяет уравнению
Ф0у (X, т) = Ф0у (X, т-Ну ) Лу (X + X* -т + Ну ) +
(18)
+Ф ух (X, т) Лху (X + X* -т), теТ \ Тц,
с начальным условием Ф^,т) = 0,те^* -Ну,X*].
Функция Фух (X, т), теТ (X), на промежутках непрерывности является решением уравнения
дФ ух (X, т)
дт
= Фух (X, т)Лх (X + X* -т) +
(19)
+Ф0у(X,т)Лух(X + X* -т),теТ(X), с начальным условием Ф ух (X, X*) = 0.
В точках це Тц она совершает скачки: Фух(X, ц + 0) = Фух(X, ц- 0) + Ф* (X, ц)Лух(X + X* - ц).
В итоге формула Коши (14) примет вид: х(X) = Фх(X,X)х(X*) + | Фху(X,X + X* - 8 - Ну) х
X, -Ну
XЛу (8 + Ну)у0 (8^ +1[Фх (X, X + X* -8)Вх (8)и(8) -
(20)
+Ф„ (X, X + X* - 8) В у (8 )у(8 )№;
у(8) = Фух (X, X) х(X*) + Фу (X, X* +Ну ) Лу (X* +Ну ) у0 +
+ | ФX + X* - 8 - Ну )Лу (8 + Ну )у0(8)ё8 +
X* -Ну
ь|ф у (X, X + X* - 8) Вх (8 )и (8)<38-
£ Ф*у (X, ц) В у (X + X* - ц)у^ + X* -ц)
+
ц=x,
+1фу (X, X + X* - 8)Ву (8^)у(8).
X
Опишем процедуру вычисления функций (15)—(19). Учитывая тождество Ф у (X, т) = 0,
теТ(X), решаем однородное уравнение дФх(X, т)/дт = Ф х (X, т) Лх (X + X* - т), те Т (X) с начальным условием Ф х (X, X*) = Е и находим Ф х (X, т), те[X*, X* + Ну]. Затем, подставив найденную функцию Фх (X, т), те^*, X* + Ну ], во второе уравнение (15), вычисляем Ф^(X,т), те^*, X* + Ну ]. Повторив описанную процедуру на последующих промежутках, вычислим Фх (X, т), Фху (X, т), теТ (X).
Из (17) находим Ф*, (X, ц), цеТц. Поскольку Фу(X,т) = 0,те[X* -Ну,X*], уравнение (19) на промежутке [X* -Ну,X*] становится однородным.
X,
ц
Решаем его с начальным условием Фyx(t,t*) = начальным условием Фyx(t,t* + hv) = Фyx(t,
= Ф* (t, t*) Ayx (t). Подставив Фyx (t, t), tg[U, t* + hv ], t* + hv - 0) + Ф* (t, t* + hv )Ayx (t - hv ). Продолжая
в (19), находим Ф0у(t,t), TG[t*„ t* + hv]. Далее ^одедур^ строим фУ(t,т), ^(t,т), tgt\TЦ.
,^0,. ч . , j -, /io\ Редукция задачи оптимального управле-
подставим ФУ(t,t),TG[t*,t* + hv], в (18), по- J „ J F
y v ния к задаче линеиного программирования.
строим функцию Фyx (t, t), tg (t* + hv, Подставим формулу Коши (20) в критерий ка-
.,-,,4 /im чества задачи ( 1 )—(5) :
t* + 2hv ), удовлетворяющую уравнению (19) с
c'xx(t * ) + c'yy(t * ) = c'x (Ф x (t *, t*) x(t*) + J Ф xy (t *, t * + t* - s - hv ) Ay (s + hv ) Уо (s )ds +
t,-hv
t* t*
+ J Ф xy (t*, t * +1* - s - hv )Ay (s + hv ) y0( s)ds + J [Ф x (t*, t * +1* - s) Bx ( s)u ( s)ds + Ф xy (t *, t * +1* - s) x
t; t*
t*
xBy (s)v(s)]ds) + cy ^(t*, t)x(t*) + Ф*У (t*, t* + hv)Ay (t* + hv)Уо + J Ф0У (t*, t* +1* - s - hv) x (21)
t.-hv
*
t V*
x Ay (s + hv ) y0 ( s)ds + J Ф y (t*, t * +1* - s) Bx ( s)u ( s)ds +£Ф*У (t *, v)By (t * +1* - v)v(t * +1* - ц) -
t* V=t*
t*
-JФ0У (t *, t * +1* - s) By ( s)v( s) ds )
t*
и обозначим
T+hu
cu(t) = J (cx Ф x (t *, t * +1* - s) + c'y Ф y (t *, t * +1* - s))Bx (s)ds, cv(t) =
t
T+h
= J КФ xy (t * + t* - s) +cy Ф У (t*, t * +1* - s)) By (s)ds.
T
Тогда критерий качества (21) примет вид
£ c'uu (t) + £ <v(T) +cxФ x (t *, t ) x(t*) + cx J Ф xy (t *, t * +1* - s - hv ) Ay ( s + hv ) Уо (s )ds +
TGTu TGTv
t*-hv
+суФух(X*,X)х(X*) + суФ*(X*,X* + Ну)Лу (X* + Ну,)у0 + су | Ф0у (X*,X* + X* - 8 - Ну,)Лу (8 + Ну)у0Ш8 + (22)
X. -Ну
ц'
+£ суФ* (X*, ц)Ву (X* +X* - цШ* +x* -ц).
ц=X*
Отбросим в (22) слагаемые, не зависящие от и (т), теТи, у(т), теТу, так как они не влияют на вид оптимальной программы. Тогда критерий качества (1) примет вид
£ c'uu (t) + £ clv(T) ^ max.
теТи теТу
Для терминального ограничения проведем аналогичные преобразования: Вестник БНТУ, № 5, 2008 75
Hxx(t*) + Hyy(t*) = Hx(Фx(t*, t*)x(t*) + J Фxy (t*, t* +t* - s - hv)Ay (s + hv)y0 (s)ds +
t,-hv
t t
+Jфxy(t*,t* +1* - s -hv)Ay(s + hv)y0(s)ds + J[Фx(t*,t* +1* - s)Bx(s)u(s)ds + Фxy(t*,t* +1* - s) x
t, t*
t*
xBy(s)v(s)]ds) + Hy (фyx(t*,t)x(t*) + Ф*(t*,t* +hv)Ay(t* +hv)y0 + J фу(t*,t* +t* -s -hv) x
t*-hv
* * t ц*
xAy(s + hv)y0(s)ds + Jфy(t*,t* +1* -s)Bx(s)u(s)ds +£o*y(t*,ц)By(t* +1* -|)v(t* +1* -ц) -t. ц=t.
t
- J фу (t*, t* +1* - s) By (s)v( s) ds ) = g.
T+hu
Обозначим: Du (т) = J (HxФx (t*, t* +1* - s) + HyФу (t*, t* +1* - s))Bx (s)ds;
T
T+hv
Dv (t) = J (HxO xy (t *, t * +1* - s) + Hy Фу (t *, t * +1* - s)) By (s )ds, g = g -(Hx Ф x (t *, t) x(t*) +
T
t*
+ J HxOxy (t\ t* +1* - s - hv )Ay (s + hv)y0 (s)ds + HyФyx (t*, t)x(t*) + Hyoy (t*, t* + hv)Ay (t* + hv)y0 +
t*-hv
J oy (t\ t* +1* - s - hv) Ay (s + hv) y0 (s)ds + £ Hy oy (t *, |^)By (t* +t* - ц)v(t * +t* -ц)).
t*-hv
Тогда терминальное ограничение (4) примет вид ^ Ви (т)и(т) + ^ Ву (т),(т) = §. Значит, за-
ТЕТи ТЕ Т,
дача оптимального управления (1)-(5) эквивалентна задаче линейного программирования:
ц=и.
£ c'uи(т) + £ c'vv(T) ^ max,
теТи TeTv
£ Du (т)и(т) + £ Dv(T)v(T) = g;
теТ„ TeTv
и* < u(t) < u*, t e Tu;v* < v(t) < v*, t e Tv.
В Ы В О Д
Получена формула Коши для одного типа гибридных систем, которая используется для вычисления оптимальных программ в линейной терминальной задаче оптимального управления.
Л И Т Е Р А Т У Р А
1. Brockett, R. W. Hybrid models for motion of control systems/ R. W. Brockett // In Essays on Control: Perspectives in the Theory and Applications. H. L. Trentelman [et al.]. -Birkhauser, 1993. - P. 29-53.
2. Габасова, О.Р. Оптимизация линейных гибридных систем управления / О. Р. Габасова // Вестник БНТУ. -
Поэтому оптимальную программу можно 2007. - № 2. - С. 71-75.
вычислить с помощью любого метода линейного программирования [3].
3. Табак, Д. Оптимальное управление и математическое программирование / Д. Табак, Б. Куо. - М.: Наука, 1975. - 279 с.
Поступила 12.12.2007