ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2015 Управление, вычислительная техника и информатика № 1 (30)
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ
УДК 517.977
Р.О. Масталиев
НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДИСКРЕТНО-НЕПРЕРЫВНОЙ СИСТЕМОЙ
Работа выполнена при финансовой поддержке Фонда развития науки при Президенте Азербайджанской Республики (грант № Е1Е/ОЛМ-2-2013-2(8)-25/0б/1).
Рассматривается задача управления ступенчатой структурой, описываемой системой разностных и интегро-дифференциальных уравнений типа Вольтерра. При предположении открытости области управления получены необходимые условия оптимальности первого и второго порядков.
Ключевые слова: разностные и интегро-дифференциальные уравнения типа Вольтерра; ступенчатая задача; вариация функционала; уравнения Эйлера.
В работах [1, 2] изучены задачи оптимального управления, соответственно, описываемые интегральными и разностными уравнениями типа Вольтерра, доказаны необходимые условия оптимальности, найдены условия управляемости и др.
Предлагаемая работа посвящена изучению одной ступенчатой задаче оптимального управления, описываемой разностными и интегро-дифференциальными уравнениями типа Вольтерра.
1. Постановка задачи
Рассмотрим задачу о минимуме функционала
5 (ы, у) = ф(х )) + ф( у (Т)) (1)
при ограничениях
х(X +1) = £/(X,т,х(т),ы(т)), X е Т = {,^ +1,^ + 2,...,X, -1} х (хо ) =
у (X) = |g (X,т,у (т),V(т))т, X е Т2 = [Т] У (1 ) = а (х (1)).
Здесь Х0, Х1, Т, х0 заданы, причем разность Х1 - Х0 - натуральное число; ф(х) и ф(у)- заданные, дважды непрерывно дифференцируемые скалярные функции; / (X, т, х, ы) - заданная «-мерная вектор-функция, непрерывная по совокупности переменных, вместе с частными производными по (х,ы) до второго порядка включительно; g (X, т, у, V) - заданная га-мерная вектор-функция, непрерывная по совокупности переменных, вместе с частными производными по (у, V) до второго порядка включительно; О (х) -заданная дважды непрерывно дифференцируемая га-мерная вектор-функция; ы (X) - г-мерный вектор управляющих воздействий со значениями из заданного непустого, ограниченного и открытого множества и; v(X) - г-мерный кусочно-непрерывный на Т2 вектор управляющих воздействий со значениями
из заданного непустого, ограниченного и открытого множества (V) , т.е.
X
х
г
0 '
(2)
и (х)еU с Яг, * е Т,
V (* )еУ с Л", * е Т2.
Пару (и (*), V (*)) с вышеприведенными свойствами назовем допустимым управлением, а соответствующий процесс (и (*), V (*), х (*), у (*)) - допустимым процессом.
Целью данной работы является вывод необходимых условий оптимальности первого и второго порядков в рассматриваемой задаче.
2. Первая и вторая вариации функционала качества
Считая (и°( *), V °(*), х°( *), у )) оптимальным процессом, обозначим через
(и (*) = и° (*) + Аи (*), V(*) = v° (*) + Av(*), х (*) = х° (*) + Ах(*), у (*) = у° (*) + Ах(*)) произвольный допустимый процесс и запишем формулу приращения функционала:
А? (и°, V °) = 5 (и, V)-5 ( и°, V °) = ф( х ())-ф( х°( )) + ф( у (Т ))-ф(у °(Т )). (4)
Ясно, что приращение (Ах (*), Ау (*)) траектории ( х °(*), у °(*)) будет удовлетворять системе
Ах( +1) = ][/(т,х(т),и (т))-/(,т,х0 (т),и0 (т))], (5)
Ах (*0 ) = 0, * е Т , (6)
Ау()={[Я(,т,у(т),V(т))-я(*,т,у0 (т),V0 (т))](т, * е Т2, (7)
Ау (*1 ) = О ( х (*1))-а ( х0 (*1)). (8)
Обозначим через (у (*),р (*)) пока неизвестную (п + т) - мерную вектор-функцию.
Умножая обе части соотношений (5), (7) соответственно на у(*) , р (*) скалярно, а затем, суммируя и интегрируя полученные тождества по множествам Т1 и Т2, будем иметь
])Ах(* +1) = ]]]]У(т)[/(т,г,х(*),и (*))-/(т,г,х0 (),и0(*))] , (9)
Т Т Т
| р'( )Ау = Ц р'(т) [ Я (т, X, у (), V ())-я (т, *, у0 (х), V0 (х ))]<(т (¡X. (10)
Ясно что,
]у'(*)Ах(* +1) = у '(*1 - 1)Ах(*1) + ]у'(*- 1)Ах(*) ,
X=X0 X =X0 Т Т
| р ' (*) Ау (* = р ' (Т )Ау (Т )-р ' (*1 )Ау (*1 )-{ р ' (* )Ау (* .
X1 4
Отсюда с учетом (8) будем иметь
Т Т
| р ' ( ) Ау ( )< = р ' (Т )Ау (Т )-р ' (*1 )(0 (х (*1))-О (( (*1 ^{р'^) Ау (* )<Ь. X1 X1 Принимая во внимания эти тождества, формула приращения (1) записывается в виде
М(и0, V= ф(х (г, )) - ф(х0 (^)) + ф(7(Т)) - ф(.у0 (Т)) + у'(^ -1) Дх (^) + +Х у'(- 1)Дх ()-£ X у'(т)[ / (, х (г), и (г))-/((, х0 (г), и0 (г ))] +
+р'(2 )Ду (Т )-р'( )( (х (1))-С (х0 (^1 )))- | р' (г)Ду (г -
4
Т Т
-Ц р ' (т)[ g (, у (г), V (г))-^ (, у 0(г), v0(г))] ^ т *.
^ г
Введем обозначения:
'1 -1 Т
Н(,х(г),и(г),у(г)) = £у'(т)/(,х,и) , М(,у(г),v(t),р(г)) = |р'(т)g(,у,V)т,
т=г г
N(х) = р'(г, -1)С(х), Я [г] = Н (г,х0(г),и0(г),у(г)), Ни [г] = Ни (г,х0(г),и0(г),у(г)), Нхх[г ] = Нхх (г, х0(г), и 0(г), у(г)), НИ[г ] = Нхи (г, х0(г), и 0(г), у(г)), Му[г] = Му (г,у0 (г), V0 (г), р(г)), [г] = (г,у0 (г),V0 (г), р(г)),
Муу[г] = Муу (г, у0 (г), V0 (г), р(г)), М„ [г] = М^ (г, у0 (г), V0 (г), р(г)), / [ г, т] = / (г, т, х0 (т), и0 (т)), /и [ г, т] = /и ( г, т, х0 (т), и0 (т)), gу [ г, т] = gу ( г, т, у0 (т), V0 (т)), gv [ г, т] = gv (г, т, у 0(т), V0 (т)).
Тогда формула приращения (11) представляется в виде
М (и0, ^) = ф( х (г1 ))-ф( х0 (г1 )) + ф( у (Т ))-ф( у0 (Т )) + у'( г1 - 1)Дх (^) +
X V '( -1) Дх () -£ [ Н (, х (г), и ( г), у(г)) - Н (, х0 (г), и0 (г), у( г))] -
г= ^ г=го
Т
+р ' (Т )Ду (Т)-(((х (1))-N (х0 (г1 ))) р' ()Ду (г)Л -
(12)
-|[М (, у (г), V ( г), р ( г)) - М (, у0 (г), V0 ( г), р ( г))].
1
Используя формулу Тейлора из (12), после некоторых преобразований получим
Д? (иV°) = фх (х0 ( г1)) Дх( г,) + 2 Дх ' ( г1 )Фхх (х0 ( ^ ))Дх (г,) + ф у (у0 (Т)) Ду(Т) +
+1 Ду ' (Т )ф( у 0(Т ))Ду(Т) + X V ' (г - 1)Дх( г) -X Н'х [г]Дх(г) -£ Н'и [г]Ди ( г) - (13)
2 г=г0 г=г0 г=г0
- 1 X Дх ' ( г) Нхх [ г] Дх( г) - 2 X Ди ' ( г) Нии [ г] Ди ( г) - X Дх ' ( г) Нхи [ х] Ди ( г) +
2 г=г0 2 г=г0 г=г0
+р (Т)Ду(Т) - NX (х0(г1))Дх(г1) - ^ Дх' (/;) ^ (х0(г1))Дх(г1) - } р ' (/)Ду(/)Л -
г1
Т Т 1 Т 1 Т
Му [г]Ду№ -1М[ - -1 Ду '(0Мда [г]Ду(г)^г - --1ДV(г)М„ [г] Дv(t)dt -
г1 \
Т
Ду ' (г)М^ [í]Дv(í)dí + л (Ди, Дv).
г
Здесь по определению
л(Дк, Av) = 01 (||Лх( ))) + о2 (|Лу (Т|2) - О3 (||Лх(1 |2) -
-I о4 (л «)2)-}о5 (к (х )|2) *,
х=хо \
где Л^(Х) = (Лх, Ли)', Лк(X) = (Лу, Лу)' .
Величины О; (•), 1 = 1,5, определяются, соответственно, из разложений
ф((^1 ))-ф(х°(1 )) = фх (х^ ))Лх(^1 ) + 2Ах'^ )фхх(х(1 ))Лх(^1 ) + 01 (|Ах(1 )||2) ,
Ф(у (Т ))-ф(у0 (Т )) = ф; (у 0(Т ))Лу (Т ) + 2 Лу'(Т )ф уу (у0 (Т ))Лу (Т ) + о 2 (|Лу (Т )2),
N (х (1))-N ((1 )) = Мх (х о(^)) Лх (1) + 2 Лх'(1 N (х (1 ))Лх (1 ) + Оз (||Лх (1)|2),
Н(х,х (X),и (х),у(X))-Н(х,х0(X),и0 (X),ц(х))= Нх[X]Лх(X) + Ни[X]Ли(Х) +
+1 Лх'( X) Нхх [X] Лх (X) + 2 Au'(X)Huu ИЛи« + Лх'(Х) Нш [X]Au(X) + о4 (( (х)|2),
М (X, у ( X), V ( X), р ( X)) - М ( X, у о ( X), Vо (X), р ( X)) = Му [ Х]Лу (X) + Му [X]Av(X) +
+2 Ay'(х )Муу [X] Лу (X) + Лу^М^ [X]Av(X) + о5 (Лк (X )||2).
Если предполагать, что вектор-функция (у(х), р (X)) является решением задачи
Ц(Х -1) = Нх[X],
у(X, -1) = -фх(х0(X,)) + Мх(х0(О), Р ( X) = Му [ X], Р (Т) = -фу (у 0(Т)), то формула приращения (13) примет вид
Г 4 -1 т '
£ Ни [X ]Ли (X) +1М [Х^(Х)аХ
5 (и0, V0) = -
Лх'^) [фхх (х0 (Xl)) - N(х0 (Xl))] Лх^) + Лу'(Т)фуу (у0 (Т))Лу(X) -
1
2
ax'(x) нхх [ x]ax( x) ли'^нии [x]au(x) - 2^ лх'(х)нш [x]au(x) -
х= X,, х= о
Т Т
-^(Ли, Av).
(15)
(16)
-1 Лу^М [ X]Ay(X)dX - ¡Л^(Х)М„ [ Х^(Х^Х - 2 { Лу'( Х)М^ [X]Av(X)dX
XI х1 х1
Уравнения (15) назовем сопряженной системой в рассматриваемой задаче управления (см., например: [4]).
Специальное приращение оптимального управления (и °( X), v°( X)), в силу открытости областей управления и, V, можно определить по формуле
Ли(X; в) = в5и( X), X е Т1, (17)
Av( X; в) = в5v( X),X е Т2. ( )
Здесь 5и( X), X е Т - произвольная г-мерная вектор-функция со значениями из Яг, 5v( X); Xе Т - произвольная кусочно-непрерывная вектор-функция со значениями из Я9; е - достаточно малое по абсолютной величине число.
Обозначим через (Ах (t;s), Ay (t;в)) специальное приращение оптимальной траектории (х°(t), y°(t)), отвечающее приращению (Au(t; в), v(t; в)) управления (u° (t),v°(t)) .
Используя формулу Тейлора и лемму Гронуолла-Белмана, из формул (5)-(7) по схеме, приведённой в [1. С. 15-21; 3. С. 86-87; 4. С. 33-38], доказывается справедливость оценок
|| Ax(t )|| < Lf |Au(t )||,
t=tn
( 18)
||Ay(t )|| ^ L
£| \Au(t )|| + J||Av(t )| dt
L = const > 0.
Из оценок (18) с учетом (17) следует, что ||Ax(t;s||, ||Ay(t;в|| имеют порядок малости s, и кроме того, для Ax(t;в) и Ay(t;в) справедливо следующее утверждение.
Лемма. Для специального приращения (Ax (t;в), Ay (t;в)) управления траектории (u°(t),v°(t)) справедливо разложение
Ax(t; в) = B8x(t) + o1 (в; t), Ay(t; в) = вбу (t) + о2(в; t).
Здесь (бх (t), бу (t)) - вариация траектории (xo(t), у°(t)) - является решением следующей системы линейных неоднородных разностных и интегро-дифференциальных уравнений типа Вольтерра:
бх (t + 1) = ]Г [ f [ t, т]5х (т) + fu [t, т] би (т)],
(19)
x=t0
(20)
5х (Г0 ) = 0,
г
5у (г) = { [ яу [г, т]5у (т) + gv [г, т]5у( т)ф т, (21)
г
5у ((1 ) = Ох (х°(^ ))5х(^).
Следуя, например [5], (20)—(21) назовем уравнением в вариациях для рассматриваемой задачи. Принимая во внимание (17)-(19), в формуле (16) показана справедливость разложения
S (uo +sôu, vo +SÔV )-S (uo, vo) = -s
4 -1
X H [t ]Au (t ) + J Mv [t ]Av(t )dt
2 L6x'(ti)[ф»(xo(ti))-Nx(xo(ti))]ôx(ti) + Sy'(T)фyy(yo(T))Sy(t)--X Sx'(t)H„[t]Sx(t) - X 5u'(t)Huu [t]Su(t) - Sx'(t)Hu [t]Su(t) -
(22)
■ |5у'(г )Му [г ]5у (г — |бу'(г )Мт [г ]5у(г )йг — 2 |бу'(г )М^ [г ]5у(г )Л + о(е2). г1 г1 г1 ] Из (22) следует, что первая и вторая вариации функционала (1) (в классическом смысле) имеют, соответственно, следующий вид:
Ô1S(uo, vo ; Su, Sv) = -£ Hu [ t]Au( t) - JMv [ t]Av(t)dt :
(23)
52 5 (м0, ; 5м, 8у) = 5х'(^ )(<р ^^ (х00 )) - Н„ (х00 ))}&&) + ^ -1 ^ -1 + 5у'(Т)ф(у0 (Т))5у(и) - £ 5х'(/)Нхх [и]5х(и) - £ 5м)Иии [и]5м(и) -
и -1 т Т
- 2
£ 5х'( ОИхи [ и]5и( и) - |5у'(и)Муу [ и]5у( ф - |5у'(Г)М^ [ -
и I 1
Т
- 2\5у'(г)Ы^ [фу№.
1
3. Необходимые условия оптимальности
Известно, что вдоль оптимального процесса первая вариация функционала качества равна нулю, а вторая вариация неотрицательна (см., например: [5. С. 51-53]), т.е.
515 (м V 5и, 5у) = 0, (25)
525(мo,Vo;5м,5v) > 0 (26)
для всех 5м( и) е Яг, и е Т1, 5v(t) е №г, и е Т2.
Из тождества (25), учитывая (23), в силу произвольности и независимости вариаций 5м (¿), 5v(t) управляющих воздействий получаем, что
И [01 = 0, 9 е Т1, ^ 1 (27)
М.V [0] = 0, 0 е Т2
есть произвольная точка непрерывности управления .( .
Результат сформулируем в виде теорем.
Теорема 1 (аналог уравнения Эйлера). Для оптимальности допустимого управления (м 0( и), V 0( ¿)) в задаче (1)-(2) необходимо, чтобы выполнялись соотношения (27).
Как обычно, допустимое управление (м0( и),V0( и)), удовлетворяющее уравнению Эйлера (27), назовем классической экстремалью в задаче (1)-(3).
Аналог уравнения Эйлера является необходимым условием оптимальности первого порядка. Используя неравенство (26), удается получить необходимые условия оптимальности второго порядка.
Применительно к задаче (1)-(3) с учетом (24) получаем справедливость
5х'(0 (ф^ (х°(0) - Нхх (х°(0) )бх(0 + +5у'(Т )фуу (у 0(Т ))5у( 0 - £5х'(0 Их [и]5х(0 - £ 5м'(0 Иии [и]5м(0 -
г=г0 и= о
1 -1 т т (28)
-2£5х'(и)Ихм И5м (и) - |5у'(0Муу [Г]5у№ -¡5v'(t)Mw -
т
-2|5у'(0МV[t]5v(t)dt > 0.
Теорема 2. Для оптимальности классической экстремали (м °(и), vo(t)) в задаче (1)-(3) необходимо, чтобы неравенство (28) выполнялось для всех 5м (и), и е Т1, 5v (и) е №, и е Т2.
Заключение
Применяя модификацию метода приращений, вычислены первая и вторая вариации терминального функционала в ступенчатых задачах оптимального управления, описываемые системой разностных и интегро-дифференциальных уравнений типа Вольтерра.
Доказано необходимое условие оптимальности первого порядка в форме аналога уравнения Эйлера. Получены условия оптимальности второго порядка.
ЛИТЕРАТУРА
1. Абдуллаев А.А., Мансимов К.Б. Необходимые условия оптимальности в процессах, описываемых системой интегральных
уравнений типа Вольтерра. Баку : Элм, 2013. 224 с.
2. Mansimov K.B., Mastaliyev R.O. Necessary first and second order optimality conditions in problems of control described by a system
of Volterra difference equations // Journal Automatic Control and Computer Sciences. 2008. V. 42, No 2. P. 71-76.
3. Мансимов К.Б. Дискретные системы. Баку : Изд-во БГУ, 2002. 114 с.
4. Габасов Р., Кириллова Ф.М. Принцип максимума в теории оптимального управления. Минск : Наука и техника, 1974. 274 с.
5. Габасов Р., Кириллова Ф.М. Особые оптимальные управления. М. : Наука, 1973. 256 с.
Масталиев Рашад Огтай оглы, доктор философии по математике. E-mail: [email protected] Институт систем управления им. ак. А. Гусейнова НАН Азербайджана, Баку, Азербайджан.
Поступила в редакцию 5 января 2015 г.
Mastaliyev Rashad Ogtay oglu (Institute of Control Systems of the Azerbaij an National Academy of Sciences, Azerbaij an). Necessary optimality conditions in problem of optimal control by discrete-continuous system.
Keywords: difference and integro-differential equations of Volterra type; stepwise problem; variation of the functional; Euler equation.
Consider a minimization problem of the functional
S (u, v ) = Ф( x (t1 )) + ф( y (T )),
t
x(t +1) = ^ f (t,x,x(x),u (x)) , t e T ={t0, t0 +1, t0 + 2,...,t1 -1},
x=t
x (t0 ) x0
t
y (t) = J g (t, x, y (x), v (x)) dx, t e T2 = [ T],
ti
y (t, ) = G (x (tl)).
Here t0, t1, t2, x0 are the given values, the difference t1 -10 is a natural number, <p( x), y) are the given continuously-differentiable scalar functions, f (t, x, x, u) , (g (t, x, y, v)) are the given n(m)-dimensional vector- functions continuous in the aggregate of variables together with partial derivatives with respect (x, u) ((y, v)) , G(x) is the given continuously-differentiable m-dimensional vector-function, u (t) (v (t)) are r(q) — dimensional vectors of control actions with the values from the given nonempty, bounded, and open set U(V), i.e.
u (t) e U c Rr, t e T1, v (t) e V c Rq, t e T2.
We call the pair (u (t), v (t)) with the above mentioned properties an admissible control, the corresponding process
(u (t), v (t), x (t), y (t)) - an admissible process.
Our goal is to derive a necessary optimality condition in the problem under above considerations.
REFERENCES
1. Abdullaev A.A., Mansimov K.B. Neobkhodimye usloviya optimal'nosti vprotsessakh, opisyvaemykh sistemoy integral'nykh uravneniy
tipa Vol'terra [Necessary optimality conditions in the process described by the system of integral equations of Volterra type]. Baku: Elm Publ., 2013. 224 p.
2. Mansimov K.B., Mastaliyev R.O. Necessary first and second order optimality conditions in problems of control described by a system
of Volterra difference equations. Automatic Control and Computer Sciences, 2008, vol. 42, no. 2, pp. 71-76. DOI: 10.3103/S014641160802003X
3. Mansimov K.B. Diskretnye sistemy [Discrete systems]. Baku: Baku State University Publ., 2002. 114 p.
4. Gabasov R., Kirillova F.M. Printsip maksimuma v teorii optimal'nogo upravleniya [Maximum principle in theory of optimal control].
Minsk: Nauka i tekhnika Publ., 1974. 274 p.
5. Gabasov R., Kirillova F.M. Osobye optimal'nye upravleniya [Special optimal control]. Moscow: Nauka Publ., 1973. 256 p.