где D0 = [0,1/(p + 1)]г. С учетом теоремы 1 имеем
inf sup
Ln<E£n(v) f £B2[0,1]r
L" f ll- ZSUP 2 g <fe-T - <) = 5 5(P-D )
8(p - 1)2 8n2/r '
Таким образом, нижняя оценка в (5) установлена. Линейный алгоритм, который дает верхнюю оценку, приведен в работе [6]. □
Работа выполнена при финансовой поддержке РФФИ (проект 07-01-00167-а) и гранта для государственной поддержки ведущих научных школ РФ (проект НШ-2970.2008.1).
Библиографический список
1. Gal S. G. Shape-Preserving Approximation by Real and Complex Polynomials. Springer, 2008.
2. DeVore R. A. The Approximation of Continuous Functions by Positive Linear Operators. Berlin; Heidelberg; N.Y.: Springer-Verlag, 1972.
3. Сидоров С.П. Оценка относительных линейных поперечников единичого шара для класса положительных операторов // Сиб. журн. индустриальной математики. 2007. Т. 10, № 4. С. 122-128.
УДК 517.977
O РЕШЕНИИ ДИСКРЕТНОЙ ЛИНЕЙНО-КВАДРАТИЧНОЙ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Н.Ю. Трошина
Саратовский государственный университет, кафедра математической экономики E-mail: [email protected]
В статье рассматривается дискретная линейно-квадратичная задача оптимального управления с закреплёнными концами и ограничениями на управление. Получены необходимые и достаточные условия оптимальности типа принципа максимума и предлагается метод точного решения краевой зачи, который сводится к решению конечного числа систем линейных алгебраических уравнений.
Ключевые слова: дискретное оптимальное управление.
4. Micchelli C. A., Rivlin T. J. Optimal estimation in approximation theory // A survey of optimal recovery. N.Y.: Plenum Press, 1977. P. 1-54.
5. Трауб Дж., Вожьняковский Х. Общая теория оптимальных алгоритмов. М.: Мир, 1983.
6. Васильев Р.К. О порядке приближения функций многих переменных линейными положительными операторами конечного ранга // Мат. заметки. 1993. Т. 53, вып. 1. С. 3-15.
About Solution of Discrete Linear-Quadratic Optimal Control Problem
N.Yu. Troshina
Saratov State University, Chair of Mathematical Economics E-mail: [email protected]
This paper is focuses on development of the method for exact solution of the optimal control problem for discrete linear system with quadratic criteria, with boundary conditions and constraints on control. This method gives a solution of finite number of systems of linear algebraic equations.
Key words: discrete optimal control.
2
r
r
Как известно, линейно-квадратичные задачи оптимального управления достаточно хорошо изучены, однако интерес к этим задачам не ослабевает [1-3]. В первую очередь это объясняется тем, что к задаче оптимизации квадратичного функционала на линейных системах приводит построение моделей многих технических и экономических процессов управления [4, 5].
В настоящей работе получены необходимые и достаточные условия оптимальности для линейной дискретной системы с закрепленными концами и квадратичным критерием качества при ограничениях на управление, которые дают в явном виде выражение оптимального управления через сопряженные переменные. Предлагается метод решения полученной краевой задачи, который сводится к последовательному решению конечного числа систем линейных алгебраических уравнений. В одном частном случае сопряженные переменные удаётся полностью исключить, что значительно упрощает процедуру вычислений. При этом получены формулы, показывающие зависимость оптимального управления и оптимальной траектории от заданных граничных условий.
Рассмотрим следующую дискретную задачу оптимального управления:
x(t + 1) = Ax(t) + bu(t), t = 0, ...,T - 1, (1)
x(0) = Xo, x(t) = xt , (2)
a < u(t) < c, t = 0, ...,T - 1, (3)
T-1
I(x, u) = ^ [(Mx(t), x(t)> + u2(t)] + (Mx(T),x(T)) ^ min, (4)
t=o
где A, M — матрицы размерности n x n, b — вектор размерности n, x(t) G Rn, u(t) G R1, x = {x(0), x(1), ..., x(T)} — дискретная траектория, u = {u(0), u(1),..., u(T — 1)} — дискретное управление, (•, •> — скалярное произведение векторов.
Будем предполагать: 1) M — неотрицательно определенная матрица, 2) система (1) управляема,
3) выполняется условие Слейтера, т.е. существует допустимая пара (X,u), такая что Vt a < u(t) < c,
4) существует A-1.
Сформулированную задачу можно рассматривать как экстремальную задачу, состоящую в минимизации функционала (4), заданного в пространстве пар (x, u)(обозначим это пространство через Z). Это векторное пространство размерности n(T + 1) + T, в котором можно определить скалярное произведение и норму:
т т-1 / т т-1 \ 2
<(х, и), (у, V)) = ]Т+ ^ и(*М*), II (х, и) ||= ]Т II х(*) II2 + ^ | и(*) |2 .
¿=0 ¿=0 \<=0 ¿=0 /
Решение задачи (1)-(4) будем обозначать (Х,и). Для получения необходимых условий оптимальности применим теорию Дубовицкого - Милютина [6].
В пространстве Z рассмотрим конусы вариаций, соответствующие функционалу (4) и ограничениям, а также сопряженные к ним. Имеем следующие представления рассматриваемых конусов [7]. Конус запрещенных вариаций для функционала (4) с вершиной в точке (х,и):
т-1
К = {(х,и) : ^[(Мх(*),х(*)> + й(*)и(*)] + (Мх(Т), х(Т)) < 0}.
¿=0
Сопряженный конус к конусу К0 состоит из функционалов вида
т-1
¿=0
Конус касательных направлений, соответствующий ограничениям (1), (2), имеет вид
T —1
fo(X, u) = — Л0 ^ [(MX(t), X(t)> + u(t)u(t)] + (MX(T), x(T)>] , Ao > 0. (5)
К = {(х, и) : х(* + 1) = Ах(£) + 6и(£), х(0) = 0, х(Т) = 0}.
Функционалы /1 из сопряженного конуса К* обладают следующими свойствами: 1) /1 (х,и) = 0, если (х,и) е К1,2) если пара (х, и) удовлетворяет (1) и начальному условию х(0) = 0, то существует вектор ш е , такой что /1 (х,и) = <ш,х(Т)).
Конус допустимых вариаций, соответствующий ограничению и(£) < с, имеет вид
К = {(х,и) : шахи(£) < 0}, П = {* : ¿(¿) = с},
причем конус К2 совпадает со всем пространством пар Z, если П = 0. Сопряженный конус К* состоит
из функционалов /2(х,и) = —АХ) а(£)и(£), где А > 0, а(£) > 0, X) а(^) = 1. Положим а(£) = 0,
геп геп
если £ / П. Тогда
т-1
/2(х,и) = — £ 7(*)«(*), (6)
¿=0
где 7(¿) = Аа(£) > 0, причем
7(*)(й(*) — с) = 0, I = 0,...,Т — 1. (7)
Если П = 0, то /2(х, и) = 0.
Конус допустимых вариаций, соответствующий ограничению u(t) > a, имеет вид
Кз = {(x, u) : max(—u(t)) < 0}, W = {t : u(t) = a}, teW
причем конус K3 совпадает со всем пространством пар Z, если W = 0. Сопряженный конус КЗ
состоит из функционалов /3(x,u) = — Л ^ в(t)(—u(t)), где Л > 0, в(t) > 0, ^ в(t) = 1. Поло-
tew tew
жим в(t) = 0, если t / W. Тогда
T-1
/з(x,u) = £ M(t)u(t), (8)
t=0
где ^(t) = Л в (t) > 0, причем
Mt)(u(t) — a) = 0, t = 0,...,T — 1. (9)
Если W = 0, то /з(x,u) = 0.
Теорема 1 (необходимые условия оптимальности). Если (x,u) — решение задачи (1)-(4), то существуют неотрицательные числа y(t), ^(t) (t = 0,... ,T — 1), существует вектор и е Rn и вектор-функция ф^) е Rn, для которых выполняется сопряженное уравнение
V>(t) = A*^(t + 1) — MX(t),
условие трансверсальности
ф(Т) = —MX(T)+ и (10)
и условия дополняющей нежесткости (7), (9). При этом оптимальное управление определяется по формуле
u(t) = (v>(t +1), 6) + Mt) — y (t), t = 0,..., t — 1.
Доказательство. Нетрудно проверить, что выполняются все условия теоремы Дубовицкого - Милютина о пересечении выпуклых конусов. Следовательно, существуют не равные одновременно нулю линейные функционалы /0, /1, /2, /3, заданные на множестве пар Z и принадлежащие сопряженным конусам, для которых имеет место уравнение Эйлера: /0 + /1 + /2 + /3 = 0. Возьмем пару (x,u), удовлетворяющую уравнению (1) и условию x(0) = 0. Тогда /1 (x,u) = (u,x(T)). Запишем уравнение Эйлера, используя формулы (5), (6),(8):
T-1 T-1 T-1
. :>ш =
t=0 t=0 t=0 t=0
—Л^(Mx(t), x(t)) — Ло ^ u(t)u(t) + (и, x(T)) — ^ y(t)u(t) + ^ ^(t)u(t) = 0. (11)
Так как пара (х,и) удовлетворяет (1), то для произвольной вектор-функции е (£ = 0,... ,Т)
т-1
имеем тождество ^ + 1), — х(£ + 1) + Ах(£) + Ьи(£)) = 0, что равносильно следующему:
¿=0
т-1 т-1 т-1
$>(*), —х(*)) — (^(0), —х(0)) + (^(Т), —х(Т)) + ^ (А>(* +1), х(*)> + ^(^ +1), Ь)и(*) = 0, (12)
¿=0 ¿=0 ¿=0
где знак * означает транспонирование. Сложим (11) и (12), учитывая, что х(0) = 0: т-1
]Г (—AoMx(t) — V(t) + A* ф(£ + 1), x(t)) + (—Ло Mx(T) + и — ф (T), x(T)) +
t=0
T-1
+ £ [—Лоu(t) + M(t) — y(t) + ^(t + 1), 6)]u(t) = 0.
Выберем так, чтобы выполнялась сопряженная система и условие трансверсальности: ^(¿) = А* + 1) — А0 Мх(^), ^ = 0,...,Т — 1, ^(Т) = —Л0Мх(Т)+ ы.
т-1
Тогда будем иметь равенство X) [—А0и(г) + м(г) — 7(г) + <ф(г + 1), Ь)]и(г) = 0, которое верно при
¿=0
любых и (г). В силу произвольности и(г) отсюда следует — А0и(г) + м(г) — 7(г) + <ф(г + 1),Ь) = 0, г = 0,...,т — 1, или
А0 и(г) = <ф(г +1), ь) + м(г) — 7 (г), г = 0,..., т — 1. (13)
Покажем, что А0 = 0. Для м(г),7(г) > 0, удовлетворяющих (7), (9), образуем функционал
т-1 т-1 т-1
)и(г) —
¿=0 ¿=0 ¿=0 ¿=0
£(х, и, А0, м, 7) = А^ <Мх(г), х(г)) + А^ и2 (г) + 2 ^ 7 (г)и(г) — 2 ^ м(г)и(г). Подсчитаем разность
£(х, и, А0, м, 7) — Ь(х, и, А0, м, 7) = а^ [<Мх(г), х(г)) — <мх(г), х(г))] + А^ [и2 (г) — и2 (г)]+
¿=0 ¿=0 т-1 т-1
+2 ^ 7 (г)(и(г) — и(г)) — 2 ^ м(г)(и(г) — и(г)).
т-1
¿=0 ¿=0 После преобразований получим:
ь(х, и, А0, м, т) — Цх, и, А0, м, т) = а^ [2<мх(г), Дх(г)) + <МДх(г), Дх(г))]+
¿=0
т-1 т-1 т-1
[2и(г)Ди(г) + (Ди(г))2 ] + ^ 27 (г)Ди(г) — ^ 2м(г)Ди(г), (14)
¿=0 ¿=0 ¿=0
где Дх(г) = х(г) — х(г), Ди(г) = и(г) — и(г)
Пусть (х, и) — допустимая пара. Согласно (12), имеем
т-1 т-1 т-1
*
]Т<ф(г), Дх(г)) — £<а*ф(г + 1), Дх(г)) — (г + 1),ь)Ди(г) = 0. (15)
¿=0 ¿=0 ¿=0
. Умножим (15) на 2 и сложим с (14). Получим
т-1 т-1
ДЬ = Ь(х,и,А0, М, 7) — £(х,и,А0,М,7) = А0 ^ <МДх(г), Дх(г)) + А0 ^ (Ди(г))2+
¿=0 ¿=0
т-1 т-1
+ ^<2А0Мх(г) + 2ф(г) — 2А*ф(г + 1), Дх(г)) + ^ (2А0и(г) + 27(г) — 2м(г) — 2<ф(г + 1), Ь))Ди(г)+
¿=0 ¿=0
+А0<МДх(Т), Дх(Т)) + <2А0Мх(Т), Дх(Т)).
При выбранных 7(г), м(г), ф(г) управление и(г) удовлетворяет (13), поэтому
т-1 т-1
ДЬ = А0 X) 2<МДх(г), Дх(г)) + А^ (Ди(г))2.
¿=0 ¿=0
Так как А0 > 0 и М — неотрицательно определенная матрица, то ДЬ > 0 при всех допустимых (х,и). Предположим, что А0 = 0. В этом случае все 7(г), м(г) одновременно в ноль не обращаются, иначе из уравнения Эйлера будет следовать, что /1 = <ш,Т) = 0, то есть все функционалы в уравнении Эйлера равны нулю, что невозможно. Предполагая, что А0 = 0, из (14) будем иметь
т-1 т-1
дь = £ 27 (г)Ди(г) — £ 2м(г)Ди(г).
¿=0 ¿=0
Так как выполняется условие Слейтера, то существует допустимая пара (х, и), для которой при всех Ь и(Ь) — а > 0, и(Ь) — с < 0. Пусть 7(Ь) = 0. Тогда из условия (7) будет следовать неравенство
7(Ь)Ди(Ь) < 0, Ь = 0,...,Т — 1, (16)
так как 7(Ь)Ди(Ь) = 7(Ь)[й(Ь) — и(Ь) + с — с] = 7(Ь)[й(Ь) — с] — 7(Ь)[и(Ь) — с] < 0. Аналогично, пусть = 0. Тогда из условия (9) будет следовать неравенство
^(Ь)Ди(Ь) > 0, Ь = 0, ...,Т — 1. (17)
Из (16), (17) вытекает, что существует пара (х,и), для которой Д£ < 0. Получили противоречие, следовательно, А0 = 0. Из (13) для оптимального управления и(Ь) получим
и(Ь) = (ф(Ь + 1), Ь) + — 7(Ь), Ь = 0,..., Т — 1.
Теорема доказана.
Теорема 2 (достаточные условия оптимальности). Пусть (х, и) — допустимая пара и пусть существуют числа 7 (Ь), (Ь = 0, ...,Т — 1), вектор ы е и вектор-функция ф(Ь) е ,
которые удовлетворяют условиям:
ф(Ь) = А* ф(Ь + 1) — Мх(Ь), Ь = 0,...,Т — 1, ф(Т) = —Мх(Т)+ ы, (18)
7 (Ь)(й(Ь) — с) = 0, 7 (Ь) > 0, Ь = 0, ...,Т — 1, (19)
д(Ь)(й(Ь) — а) = 0, > 0, Ь = 0,...,Т — 1, (20)
а управление и(Ь) определяется по формуле
й(Ь) = (ф(Ь + 1), Ь) + — 7(Ь), Ь = 0,..., Т — 1. (21)
Тогда (х,й) является оптимальной парой для задачи (1)-(4).
Доказательство. Возьмем произвольную допустимую пару (х, и) и подсчитаем
т т-1
и) — I (х, и) = У"[(Мх(Ь),х(Ь)) — (мх(Ь),х(Ь))] + У [и2(Л — ^2<
Д1 = I(х, й) — I(х, и) ^[(Мх(Ь), х(Ь)) — (Мх(Ь), х(Ь))] + ^ [и2(Ь) — й2(Ь)] =
¿=0 ¿=0 т т-1
= 5][2<мх(*), Дх(Ь)) + (МДх(Ь), Дх(Ь))] + ^ [2и(Ь)Ди(Ь) + (Ди(Ь))2],
¿=0 ¿=0
где Дх(Ь) = х(Ь) — х(Ь), Ди(Ь) = и(Ь) — и(Ь).
Так как (х, и), (х, и) — допустимые пары, то, согласно (12), для (Дх, Ди) имеем
т-1 т-1 т-1
2 £ (ф (Ь), Дх(Ь)) — 2 £ (А* ф(Ь + 1), Дх(Ь)) — 2 ^ (ф(Ь + 1), Ь)Ди(Ь) = 0.
¿=0 ¿=0 ¿=0
Используя это равенство, для Д1 можно получить
т т-1 т
Д1 = ^(МДх(Ь), Дх(Ь)) + ^ (Ди(Ь))2 + 2 ^(Мх(Ь) + ф(Ь) — А*ф(Ь + 1), Дх(Ь)) +
¿=0 ¿=0 ¿=0 т-1
+2^>(Ь) — (ф(Ь + 1),Ь)]Ди(Ь).
¿=0
Учитывая (18), (21), получим
т т-1 т-1 т-1
Д1 = Е(МДх(Ь), Дх(Ь)) + ^(Ди(Ь))2 + ^(—7(Ь)Ди(Ь)) + 2 £ ^(Ь)Ди(Ь).
¿=0 ¿=0 ¿=0 ¿=0
Очевидно, при всех Ь = 0,..., Т — 1 имеет место равенство
7 (Ь)Ди(Ь) = 7 (Ь)[и(Ь) — й(Ь) + с — с] = 7 (Ь)[и(Ь) — с] — 7 (Ь)[и (Ь) — с].
Используя условие (19), получим 7(Ь)Ди(Ь) < 0, Ь = 0,... ,Т — 1. Аналогично можно показать, что д(Ь)Ди(Ь) > 0, Ь = 0,... ,Т — 1. Так как М — неотрицательно определенная матрица, отсюда будет следовать, что Д1 > 0 для любой допустимой пары. Поэтому (X, и) — оптимальна. Теорема доказана.
Доказанные теоремы позволяют свести решение задачи оптимального управления (1)-(4) к решению следующей краевой задачи:
х(Ь + 1)= Ах(Ь) + 66* +1) — 67 (Ь) + Ь = 0,...,Т — 1 (22)
ф(Ь) = А* + 1) — Мх(Ь), Ь = 0,...,Т — 1 (23)
х(0) = хо, х(Т) = хт, (24)
7(Ь)[6*+1) — 7(Ь) + — с] = 0, Ь = 0,..., Т — 1, (25)
^(Ь)[6*+ 1) — 7(Ь) + М*) — а] = 0, Ь = 0,..., Т — 1, (26)
7(Ь) > 0, > 0, Ь = 0,..., Т — 1. (27)
Теорема 3. Если векторы х(Ь), ф(Ь) удовлетворяют уравнениям (22), (23), то они выражаются через граничные значения х(Т), ф(Т) «о формулам
т-1 т-1
х(Ь) = А*х(Т) + ВФ(Т) + ^ Р(т)7(т) + ^ О(т)М(г), (28)
т=4 т=4
Т-1 Т-1
ф(Ь) = Сх(Т) + АФ(Т) + ^ ^(т)7(т) + ^ Я*(т)м(т), Ь = 0,..., Т — 1, (29)
т=4 т=4
где матричные коэффициенты Аь, Вь, Сь, Рь(т), О (т), N (т), (т) определяются следующими рекуррентными соотношениями:
Ат-1 = А-1, Вт-1 = —А-166*, Рт-1(Т — 1) = А-16, От-1(Т — 1) = — А-16, Ст-1 = —МАт-1, Бт-1 = А* — Вт-1, -1 (Т — 1) = — МРТ-1 (Т — 1), Ят-1 (Т — 1) = — МОт-1 (Т — 1);
для Ь = 0, ...,Т — 2:
Аь = А-1 (Ат — 66* Ст), В = А-1(Вт — 66* А+1), Рь(т) = А-1 (Рь+1 (т) — 66*N4+1 (т)) (т = Ь + 1,... ,Т — 1), Р(Ь) = А-16, (30)
О(т) = А-1 (О4+1 (т) — 66*Ят(т)) (т = Ь + 1,..., Т — 1), = —А-16;
С = А* Ст — МАь, А = А* А+1 — МВь, ^(т) = А*N¿+1 (т) — МРь(т) (т = Ь + 1,..., Т — 1), N4(Ь) = — МР(Ь), (31)
ЯЬ(т) = А*ЯЬ+1 (т) — МОь(т) (т = Ь + 1,..., Т — 1), Яь(Ь) = —МО(Ь).
Доказательство. Из уравнения (22) при Ь = Т — 1 имеем
х(Т — 1) = А-1 [х(Т) — 66*ф(Т) + 67 (Т — 1) — 6д(Т — 1)] = А-1 х(Т) — А-166* ф(Т)+ +А-167 (Т — 1) — А-16д(Т — 1) = Ат-1х(Т) + Вт-1 ф(Т) + Рт-1 (Т — 1)7 (Т — 1) — От-1 м(Т — 1).
Следовательно, формула (28) верна для Ь = Т — 1. Аналогично из уравнения (23):
ф(Т — 1) = А* ф(Т) — М [Ат-1 х(Т) + Вт-1 ф(Т) + Рт-1 (Т — 1)7 (Т — 1) + От-1 (Т — 1)^(Т — 1)] = = —МАт-1х(Т) + (А* — МВт-1ЖТ) — МРт-1 (Т — 1)7 (Т — 1) — МОт-1 (Т — 1)^(Т — 1) = = Ст-1 х(Т) + Бт-1 Ф(Т) + ^т-1 (Т — 1)7 (Т — 1) + Ят-1(Т — 1)^(Т — 1).
Отсюда следует, что формула (29) верна для Ь = Т — 1. Пусть утверждение теорема выполняется для некоторого момента времени Ь. Покажем, что оно справедливо для момента Ь — 1. Согласно (22), имеем
-1
Аьх(Т) + Вьф(Т) + ^ Рь(т)7(т) + ^ Оь(т)М(т)
т=ь т=ь
т-1 т-1
Сьх(Т) + Аф(Т) + ^ Nь(т)7(т) + ^ Яь(т)Мт)1 + А-167(Ь — 1) — А-16^ — 1) =
х(Ь — 1) = А-1[х(Ь) — 66* ф(Ь) + 67 (Ь — 1) — 6д(Ь — 1)] =
т-1 т-1
= А-1[ ......
т=ь т=ь
п т-1 т-1
—А-166*"....... ^
т=ь т=ь
т-1
= А-1 [Аь — 66*Сь]х(Т) + А-1 [Вь — 66*Бь]ф(Т) + ^ А-1 [Рь(т) — 66*N(т)]7(т) + А-167(Ь — 1) +
т=ь
т-1
+ 5] А-1 [Оь(т) — 66*Яь(т)]^(т) — А-16^ — 1) = Аь-1 х(Т) + Вь-1 ф(Т) +
т=ь
т-1 т-1
+ 2 Рь-1 (т)т(т) + Рь-1 (Ь — 1)7(Ь — 1) + Е Оь-1 (т)м(т) + Оь-1(Ь — 1)^ — 1).
т=ь т=ь
Таким образом, получили
т-1 т-1
х(Ь — 1)= Аь-1 х(Т)+ Вь-1 Ф(Т)+ ^ Рь-1 (т)7(т)+ ]Т Оь-1 (т)^(т),
т=ь-1 т=ь-1
т. е. формула (28) верна для Ь — 1, причем коэффициенты Аь-1, Вь-1, Рь-1 (т), Оь-1 (т) удовлетворяют формулам (30) для момента Ь — 1. Аналогично из (23) имеем
т-1 т-1
— 1) = А*ф(Ь) — Мх(Ь — 1) = А* [Сьх(Т) + Бьф(Т) + ^ Nь(т)7(т) + ^ Яь(т)^(т)] —
т=ь т=ь
т-1 т-1
—М[Аь-1 х(Т) + Вь-1 Ф(Т)+ ^ Рь-1 (т)7(т)+ ^ Оь-1 (т)^(т)] = (А*Сь — МАь-1 )х(Т) +
т=ь-1 т=ь-1
т-1
+ (А* Бь — МВь-1 )ф(Т) + £)[А* Nь (т) — МРь-1(т )]7 (т) — МРь-1 (Ь — 1)7 (Ь — 1) +
т=ь
т-1
+ ^ [А* Яь(т) — МОь-1 (т )]^(т) — МОь-1 (Ь — 1)МЬ — 1).
т=ь
Отсюда получим
т-1 т-1
— 1) = Сь-1 х(Т) + Бь-1 ф(Т)+ ^ (т)7(т)+ ^ Яь-1(т)^(т),
т=ь-1 т=ь-1
где коэффициенты Сь-1 ,Бь-1 ,Nь-1 (т),Яь-1 (т) удовлетворяют соотношениям (31) для Ь — 1. Теорема доказана.
Рассмотрим возможные пути решения краевой задачи (22)-(27). Запишем формулу (28) для Ь = 0:
т-1 т-1
х(0) = Аох(Т) + Воф(Т) + ^ Ро(т)7(т) + ^ Оо(т)^(т). (32)
т=о т=о
С учетом граничных условий (2) из (29), (32) получим систему уравнений, в которой отсутствуют переменные состояния:
т-1 т-1
Воф(Т) + ^ Ро(т)7(т) + ^ Оо(т)Мт) = хо — Аохт, (33)
т=о т=о
т-1 т-1
Аф(Т) — ф(Ь) + £ N(т)7(т) + £ Д(т)^(т) = — Схт, Ь = 0,..., Т — 1. (34)
т= т=4
Для нахождения сопряженных переменных ф(Ь) и множителей 7(Ь), будем иметь систему (33), (34), (25)-(27), которая разрешима, поскольку задача (1)-(4) имеет решение. Левые части уравнений (25)-(26) представляют собой произведение двух сомножителей: 7(Ь) (или д(Ь)) и выражений в квадратных скобках. Приравнивая один из них к нулю, вместе с (33)-(34) будем получать системы линейных алгебраических уравнений относительно ф(Ь), 7(Ь), Таким образом, решение краевой задачи сводится к последовательному решению конечного числа систем линейных алгебраическмх уравнений. Решение, для которого будет выполняться условие (27), будет искомым. По формуле (28) мы сможем вычислить оптимальную траекторию, а по формуле (26) — оптимальное управление.
Рассмотрим случай, когда матрица В0 в форомуле (32) невырожденная. В этом случае оптимальное управление и оптимальную траекторию можно в явном виде выразить через заданные граничные условия и множители 7(Ь), Для этого из (34) найдем
т-1 т-1
-1
0
ф(Т) = В0-1 к — А0хт — Е Р0(т)7(т) — Е ^0(т)^(т)
0
т=0 т=0
Подставим найденное ф(Т) в (28). Получим
т-1 т-1 т-1
х(Ь) = А;х(Т) + В;Б0-1 [х0 — А0хт — ^ Р0(т)7(т) — ^ ^(т)^(т)] + ^ р(т)7(т)
т=0 т=0 т=
т-1 т-1
+ £ ^ (т )м(т) = А* х(Т) + В В-1 х0 — В4 В0-1 А0 хт — ^ В В0-1 Р0 (т )7 (т)+
т = т=0
т-1 т-1 т-1
+ Е р(т)7(т) — ^ В4В0-1 ^0(т)м(т) + £ д(т)М(т),
т = т=0 т=
или
т-1 т-1
х(Ь) =
т=0 т=0
(Ь) = X) К(т)7(т) + Е (тИт) + Кх0 + хт, Ь = 1,..., Т — 1,
где К*(т) = — В*В0-1 Р0(т), если т = 0,...,Ь — 1, К(т) = — В*В0-1 Р0(т) + Р(т), если т = Ь,...,Т — 1; К = В^-1; ^(т) = — В*В0-1д0(т), если т = 0,...,Ь — 1; ^(т) = — В*В0-1 д(т) + д(т), если т = Ь, . . . , Т — 1; и = А* — В^-1 А0.
Аналогично, подставив найденное ф(Т) в (29), получим выражение сопряженного вектора ф(Ь) через граничные условия:
т-1 т-1
Ф(Ь) = Е ^(т)7(т) + £ Я*(т)^(т) + Сх0 + Нхт,
т=0 т=0
где коэффициенты С(т(тудовлетворяют формулам: С(т) = — АВ-1 Р0(т), если т = 0,...,Ь — 1; С(т) = — АВ0-1 Р0(т) + N(т), если т = Ь,...,Т — 1; С = А В-1; Я*(т) = — АВ0-1 ^0(т), если т = 0,...,Ь — 1; Я(т) = — АВ0-1 ^(т) + Д(т), если т = Ь,...,Т — 1; Я = С — А В0-1 А0.
Для оптимального управления, согласно (26), будем иметь
т-1 т-1
и(Ь) = ( Е (т)7(т) + £ Ят(т)м(т) + х0 + Ят хт, б) + М*) — 7(Ь), Ь = 0,..., Т — 1.
т=0 т=0
Теперь подставим найденное ф(Ь) в (25), (26) и получим уравнения для нахождения 7(Ь), д(Ь): т-1 т-1
7(Ь) [б* ( ]Т (т)7(т) + ^ Ят (тИт) + х0 + Ятхт) — 7(Ь) + М*) — с] =0, (35)
т=0 т=0
T-1
T-1
М*) [b* (J] Gt+1 (т )y (т ) + ^ Ht+i (т )M(r) + Gt+i xo + Ht+iXr) - Y (t) + M*) - «
= 0,
(36)
т=о т=о
где Ь = 0, ...,Т — 1.
Как и в предыдущем случае, приравнивая один из сомножителей в (35)-(36) к нулю, будем решать полученные системы линейнах алгебраических уравнений. Решение с неотрицательными 7(Ь), будет искомым. Его существование следует из существования решения зачи (1)-(4).
Таким образом, в случае, когда матрица Во невырожденная, чтобы решить поставленную задачу, нужно найти неотрицательные коэффициенты 7(Ь), удовлетворяющие системе уравнений (35)-(36).
Библиографический список
1. Киселев Ю.Н. Линейно-квадратичная задача оптимального управления: анализ с помощью принципа максимума // Проблемы динамического управления: Сб. науч. тр. М.: Изд-во Моск. ун-та, 2005. Вып. 1. С. 166-182.
2. Киселева О.Н. Минимизация основных показателей качества в линейных дискретных системах // АиТ. 2005. № 3. С. 65-73.
3. Czornir A. О неавтономный линейно-квадратичной задаче с дискретным управлением // Intern. J. Appl. Math. and Comput. Sci. 2002. V. 12, № 2. P. 78-85.
4. Ширяев В.И., Баев И.А., Ширяев Е.В. Экономико-
математическое моделирование управления фирмой. М.: КомКнига, 2006.
5. Лагоша Б.А., Апалькова Т.Г. Оптимальное управление в экономике: теория и приложение. М.: Финансы и статистика, 2008.
6. Дубовицкий А.Я. Милютин А.А. Задачи на экстремум при наличии ограничений // ЖВМ и МФ. 1965. № 3. С. 395-453.
7. Трошина Н.Ю. Принцип максимума и задача синтеза для линейных дискретных систем: Дис. ... канд. физ.-мат. наук. Саратов, 1997.