ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2022 Управление, вычислительная техника и информатика № 61
Tomsk: State UniversityJoumal of Control and Computer Science
УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ CONTROL OF DYNAMICAL SYSTEMS
Научная статья УДК 517.977.56 doi: 10.17223/19988605/61/1
Об одной дискретной задаче управления, описываемой разностным уравнением типа Вольтерра и негладким критерием качества
Махнура Узеир кызы Чырахова
Институт систем управления НАН Азербайджана, Баку, Азербайджан, [email protected]
Аннотация. Рассматривается задача оптимального управления процессами, описываемая нелинейным разностным уравнением типа Вольтерра и негладким критерием качества. Доказаны необходимые условия оптимальности в терминах производных по направлениям. Отдельно изучена задача на минимакс. Получены дискретные аналоги принципа максимина и линеаризованного принципа максимина.
Ключевые слова: разностное уравнение, негладкий функционал, производная по направлению, необходимое условие оптимальности, допустимое управление, задача на минимакс, принцип максимина
Для цитирования: Чырахова М.У. Об одной дискретной задаче управления, описываемой разностным уравнением типа Вольтерра и негладким критерием качества // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2022. № 61. С. 4-11. doi: 10.17223/19988605/61/1
Original article
doi: 10.17223/19988605/61/1
On the one discrete control problem described by Volterra type difference equation
and non-smooth quality criterion
Mahnura U. Chirakhova
National Academy of Sciences of Azerbaijan, Institute of Control Systems, Baku, Azerbaijan [email protected]
Abstract. The work devoted to study of one optimal control problem described by a system of nonlinear Volterra type difference equations, with a non-smooth quality functional assuming that the quality functional satisfies the Lipschis condition and has directional derivatives.
Using method based on linearization of equation of process under several of assumptions necessary conditions of optimality in terms of derivatives in direction are established.
The minimax control problems has been separately considered. That is that problem of finding the minimum value of the functional of the type maximum (problem by minimax). Using the derivative formula in a direction of the function of maximum type under the assumption of the convexity of the analogue of the set of permissible velocities, the necessary condition of optimality of the type of the maximum principle is proved. In the case of the convexity of the control domain, an analogue of the linearized principle of maximum is proved.
Keywords: difference equation; non-smooth functional; directional derivative; necessary optimality condition; admissible control; problem of minimax; maximin principle
© М.У. Чырахова, 2022
For citation: Chirakhova, M.U. (2022) On the one discrete control problem described by Volterra type difference equation and non-smooth quality criterion. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychis-litelnaja tehnika i informatika - Tomsk State University Journal of Control and Computer Science. 61. pp. 4-11. doi: 10.17223/19988605/61/1
В работе [1] изучена одна задача оптимального управления, описываемая системой разностных уравнений типа Вольтерра с гладким терминальным критерием качества, доказан ряд необходимых условий оптимальности типа принципа максимума Л.С. Понтрягина и также исследован случай их вырождения [2-5].
В работе [6] установлен ряд необходимых условий для существования седловой точки. В предлагаемой работе изучается случай негладкого функционала качества. Доказаны необходимые условия оптимальности в терминах производных по направлениям. Отдельно изучена задача на минимакс.
1. Постановка задачи
Пусть T = [t0,t0 +1,...,tx} - заданный дискретный отрезок времени, U с Rr - заданное непустое и ограниченное множество, u (t) - r-мерная дискретная управляющая функция, удовлетворяющая ограничению
u (t)e U, t e T, (1)
которую назовем допустимым управлением, а Ф(х) - заданная скалярная функция, удовлетворяющая условию Липшица и имеющая производные по любому направлению.
Предположим, что управляемый процесс описывается системой нелинейных разностных уравнений типа Вольтерра
t
x(t) = Х f (t,X,x(x),u(x)), t eT. (2)
T=tj
Здесь f (t, x, x, u) - заданная n-мерная вектор-функция, непрерывная по (x, u) с частными производными по x при всех (t, т).
Задача оптимального управления заключается в нахождении минимального значения терминального функционала
S (u ) = Ф( x (ti)) (3)
при ограничениях (1), (2).
Допустимое управление u (t), доставляющее минимальное значение функционалу (3) при ограничениях (1), (2), называется оптимальным управлением.
2. Необходимые условия оптимальности в терминах производных по направлениям
Пусть (u (t), x (t)) - фиксированный допустимый процесс, множество
f (t, x, x(x), U) = {a: a = f (t, x, x(x), v), v e U} (4)
выпукло при всех (t, x) , а se [0,1) - произвольное число.
Через x (t; s) обозначим произвольное допустимое управление, такое что t t t x(t; s) = X f (t, x, x(x; s), u(x; s)) = Д(1 -s)f (t, x, x(x; s), u(x))] + ^sf (t, x, x(x; s), v(x)), (5)
X=^0 X=^0 X=^0
где v(t) - произвольное допустимое управление.
Это возможно в силу выпуклости множества (4).
Введем обозначение:
ôx(t; s )
У (t ) = -
ôs
(6)
s=0
Из (5), в силу условий гладкости, наложенных на правую часть уравнения (2), следует, что вектор-функция y(t), определяемая формулой (6), является решением уравнения в вариациях
t
y(t) = Z[ (t, x, *(x), u(x) )y(x) + (f (t, x, x(x), V(T) )-f (t, X, x(x), u(x) ))]. (7)
1=%
Из (6) ясно, что
x(t; s) = x(t ) + sy(t ) + o(s;t). (8)
Вычислим специальное приращение функционала качества (3), соответствующее допустимым управлениям u(t : s), u(t) . Имеем
S (u(t; s)) - S (u(t )) = Ф ( x (*,; s)) - Ф ( x (t )) = [ф ( x (t ) + sy(t1 ) + o(tl; s) ) -- Ф( x (ti ) + sy(ti ) )] - [ф( x (ti ) + sy(ti ) ) - Ф( x (ti ))]. По предположению функция Ф( x ) удовлетворяет условию Липшица. Поэтому получаем, что
|ф( x (ti ) + sy(ti ) + o(s)) - Ф( x (ti ) + sy(ti ))| < Oi (s). (10)
Далее, используя определение производной по направлениям, получаем, что
Ф( x (ti ) + ву(^))-Ф( x (ti ^ ^ )) + o2(s). (11)
Если предполагать, что допустимое управление u (t ) оптимальное, то из (11), учитывая соотношения (10), (11), получаем
0Ф( x (ti ))
Г +Os(s) > 0. (12)
0У (ti )
Из этого неравенства следует
Теорема 1. Если множество (4) выпуклое, то для оптимальности допустимого управления u (t) необходимо, чтобы неравенство
5Ф( x (ti ))
—V-^ > о (13)
ôy (ti ) ( )
выполнялось для всех v(t) e U, t e T.
Неравенство (13) является общим необходимым условием оптимальности и носит неявный характер.
Перейдем к конкретизации полученного необходимого условия оптимальности. Уравнение в вариациях является линейным неоднородным разностным уравнением. Из результатов работ [7, 8] следует, что решение y(t) уравнения в вариациях допускает представление
t
y(t ) = £( f (t, x, x(x), v(x) )-f (t, x, x(x), u(x) ))-
t x x=t0 (14)
-XZR(t, x) ( f (t, S, -Ф), v(s) )-f (t, s, x(s), u(s) )),
x=t0 S=^0
где R(x,t) (n x n) - матричная функция, являющаяся решением матричного разностного уравнения
x
R(t,x) = £R(t, s)( fx (s, t, x(t),u(t)) - fx (x, t, x(t),u(t))), to < t < x.
По аналогии с [7, 8] можно показать, что матричная функция R (т, t ) является также решением уравнения
т
R(t,T) = X( f (т,x(s),u(s))R(s,т) - fx (т,t,x(t),u(t))). (15)
s=t
С помощью дискретного аналога теоремы Фубини (см., напр.: [8]) представление (14) преобразуется к виду:
Положим
y(t) = X[( f (t, т,х(т), v«))- f (t, т, х(т),м(т)))-
т=0
т
-X R(t, s) ( f ( s, т, х(т), У(т) )-f ( s, т, х(т), и(т) ))
s =t
k
L(v) = X ( f (t, t, x(t ), v(t ) ) - f (tj, t, x(t ), u(t ) )) --£ R(tj, т) ( f ( т, t, x(t), v(t)) - f (т, t, x(t),u(t))).
(16)
(17)
С учетом (13), (17) теорема 1 может быть сформулирована в виде:
Теорема 2. Если множество (4) выпуклое, то для оптимальности допустимого управления и (г) в рассматриваемой задаче необходимо, чтобы неравенство
дФ(*(*1))
дф)
> 0
(18)
выполнялось для всех v(t ) e U, t e T.
3. Линеаризованное необходимое условие оптимальности
Предположим, что вектор-функция f (t, т, x,u) непрерывно-дифференцируема по (x, u), а множество U выпукло. В силу сделанных предположений можно написать «возмущенную» систему вида:
t
x(t; ц) = X f (t, т, x(c; ц), и(т : ц)) =
т=° (19)
= X (j - s)f (t, т, x(т; ц), ^(т) + (1 - ц)и(т) ),
т=°
где це[0,1) - произвольное число, а v(t ) - произвольное допустимое управление. Предположим
dx(t; ц)
z(t, v) = -
дц
(20)
ц=0
Из (19) следует, что 2(г, V), определяемое формулой (20), является решением следующего уравнения в вариациях:
г
2(г,V) = X [/ (г, х,х(т),V(x))2(1,V) + /и (г, Х, х(х),и(х))(v(x) - и(х))]. (21)
т=*о
Запишем специальное приращение критерия качества, соответствующее допустимым управлениям и(г;ц), и(1г). Имеем
£ (и(г; ц)) - £ (и(г)) = [ф( х (г,) +, V) + о(ц)) - Ф( х (г,) + ^, V))] = + °(Ц). (22)
т=т.
Из полученного разложения следует
Теорема 3. Если множество U выпукло, то для оптимальности допустимого управления и (г) в рассматриваемой задаче необходимо, чтобы неравенство
5Ф( х (г,))
> 0 , V)
выполнялось для всех V(г) е и, г е Т.
Конкретизируем полученное необходимое условие оптимальности. Решение z(í, V) линеаризованного уравнения (21) представимо в виде
г х х
*, V) = £ fи (г, х, х(х), и(х))(v(х) - и(х) )-££[>(', (х, х(х), и(х))](ф) - и(х)),
(23)
(24)
x=t)
x=t0 S=t
где Я (х, г) решение уравнения (15). Введя обозначение
из (24) получаем, что
Следовательно,
Положим
Q(t, x) = fu (t, x, x(x),u(x)) + £ [R(t, s)fu (s, x, x(x),u(x))],
z(t, V) = XQ(t,x)(v(x) -u(x)).
1
z(ti, v) = XQ (ti, t )(v(t) - u(t)).
"1
L2(v) = £ Q (ti,t )(v(t) - u(t)).
Тогда теорема 3 может быть сформулирована в виде:
Теорема 4. Если множество U выпукло, то для оптимальности допустимого управления и (г) в рассматриваемой задаче необходимо, чтобы неравенство
5Ф( х ^))
db2(v)
> 0
(25)
выполнялось для всех V(г) е и, г е Т.
s=x
x=t
x=t
x=t
4. Необходимое условие оптимальности в задаче на минимакс
Рассмотрим задачу о минимуме функционала типа максимум
£ (и) = тах ае_А ф(х(^), а), (26)
при ограничениях (1)-(5), где ф(х, а) - заданная, непрерывно-дифференцируемая по х скалярная
функция, А е Я - заданное непустое и ограниченное множество.
Задачи оптимального управления с функционалом типа (26) обычно называются задачами на минимакс. В работах [2, 9, 10] при различных предположениях изучен ряд свойств функций типа максимум или же минимум. В частности, установлена формула для производной по направлению функций типа максимум.
Используя дифференциальные свойства функций типа максимум, получим необходимое условие оптимальности в задаче на минимакс.
Пусть и (г) в задаче (1)-(5) является оптимальным управлением. Тогда из теоремы 2 получаем,
что вдоль процесса (и (г), х (г))
-1 max ф(x(tj ), а) ) > 0.
дЦ (v) \ aeA
Пусть A(x) - множество максимумов функции ф^,a), т.е.
A(x(t)) = {a e A : ф(x(t), a) = max ф(x(tj), a)} max ф(x(t), a).
( aeA J aeA
Учитывая известную формулу о производной по направлению функции типа максимум (см., напр.: [9, 10]), из неравенства (18) получаем, что
-Мmaxф(x(ti),a))= max, дф'(^a) A(v) > 0. (27)
дЦ (v) V aeA ) aeA(x(ti)) dx
Принимая во внимание выражение Ц (v) из (17), неравенство (27) записывается в виде:
дф'(x(tj), a)
max
аеЛ( x(t,)) Qx
t
£ ( f ( ti, t, x(t ), v(t ) ) - f ( t,, t, x(t ), u(t ) )) -
(28)
> 0.
- É R(b> т) ( f ( Tt, ), )) - f (т,t, x(t), u(t) ))
T.=to
Введем обозначения
v. (t )R(t„ T),
dx
h
H (t, x(t), u(t), v. (t)) = -ф' (x(t ), a)f (t, t, x(t), u(t)) + X v' (t)f (т, t, x(t), u(t)).
x=i0
Тогда неравенство (28) записывается в виде:
jmm^ (H (t,, x(t), v(t), va (t)) - H (t,, x(t), u(t), va (t))) < 0. (29)
Сформулируем полученный результат:
Теорема 5. Для оптимальности допустимого управления u(t) в рассматриваемой задаче (1), (2), (26) необходимо, чтобы неравенство (29) выполнялось для всех v ( t) e U, t e T.
Перейдем теперь к доказательству линеаризованного условия максимина при выполнении предположений теоремы 3.
При выполнении условий теоремы 3 получаем, что вдоль оптимального управления u(t) выполняется неравенство
dф'(x(tj),а) Т , max -1-Z2(v) > 0.
aeA(x(ti)) dx
Учитывая выражение Z2 (v), последнее неравенство записывается в виде:
max fo'(x(tl),а) Vq(t,t)(v(t) -u(t))> 0
aeA(x(h)) dx Х У У'>
T-Î0
для всех v (t )e U, t e T.
Следовательно, учитывая вид функции Гамильтона Понтрягина, приходим к следующему утверждению:
Теорема 6. Если множество U выпуклое, а f (t, т, x,u) имеет также по u непрерывную производную, то для оптимальности допустимого управления u(t) в задаче (1)-(2), (26) необходимо, чтобы неравенство
min H (t,x(t),u(t), va(t))(v(t) -u(t)) < 0 (30)
aeA(x(tj)) 4 ' 4 '
выполнялось для всех v (t ) e U, t e T.
5
%=t.
Неравенство (30) является аналогом линеаризованного принципа максимина, доказанный в работе [11], для задачи оптимального управления обыкновенными дифференциальными уравнениями.
Заключение
В работе рассматривается дискретная задача оптимального управления, описываемая системой разностных уравнений Вольтерра и недифференцируемым функционалом качества. Получены общие необходимые условия оптимальности, которые охватывают задачу в минимакс, также используя дифференциальное свойство функций максимума, доказаны необходимые условия оптимальности в форме принципа максимина и линеаризованного принципа максимина.
Список источников
1. Мансимов К.Б., Чырахова М.У. Об одной задаче управления процессами описываемыми разностными уравнениями
Вольтерра // Вестник Бакинского государственного университета. Сер. физико-математических наук. 2019. № 1. C. 6689.
2. Габасов Р., Кириллова Ф.М., Альсевич В.В. Методы оптимизации. Минск : Четыре четверти, 2011. 472 с.
3. Габасов Р, Кириллова Ф.М. Особые оптимальные управления. М. : Либроком, 2011, 256 с.
4. Мансимов К.Б. Дискретные системы. Баку : Изд-во Бакинского гос. ун-та, 2013. 151 с.
5. Васильев Ф.П. Методы оптимизации. М. : Факториал пресс. 2002. 814 с.
6. Мансимов К.Б., Чырахова М.У. О необходимых условиях существования седловой точки в задаче оптимального управле-
ния для систем разностных уравнений типа Вольтерра // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2022. № 59. C. 4-12.
7. Колмановский В.Б. Устойчивость дискретных уравнений Вольтерра // Доклады РАН. 1996. Т. 349, № 5. C. 40-61.
8. Колмановский В.Б. Об асимптотических свойствах решений некоторых нелинейных систем Вольтерра // Автоматика и
телемеханика. 2000. № 4. C. 42-50.
9. Демьянов В.Ф., Рубинов А.М. Основы негладкого анализа и квазидифференциальное исчисление. М. : Наука, 1990. 432 с.
10. Демьянов В.Ф., Малоземов В.Н. Введение в минимакс. М. : Наука, 1972. 368 с.
11. Габасов Р., Кириллова Ф.М. Принцип максимума в теории оптимального управления. М. : Либроком, 2011. 272 с.
References
1. Mansimov, K.B. & Chirakhova. M.U. (2019) On one problem of process control described by Wrolterra difference equations.
Vestnik Bakinskogo gosudarstvennogo universiteta. Ser. fiziko-matematicheskikh nauk - Bulletin of the Baku State University. Univer. ser. Phys.-Math. Sciences. 1. pp. 66-89.
2. Gabasov, R., Kirillova, F.M. & Alsevich, V.V. (2011)Metody optimizatsii [Optimization methods]. Minsk: Chetyre chetverti.
3. Gabasov, R. & Kirillova, F.M. (2011) Osobye optimal'nye upravleniya [Singular optimal controls]. Moscow: Librokom.
4. Mansimov, K.B. (2013) Diskretnye sistemy [Discrete Systems]. Baku: Baku State University.
5. Vasilyev, F.P. (2002)Metody optimizatsii [Optimization methods]. Moscow: Faktorial press.
6. Mansimov, K.B. & Chyrakhova, M.U. (2022) On necessary conditions for the existence of a saddle point in the problem of opti-
mal control for systems of difference equations of Volterra type. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika - Tomsk State University Journal of Control and Computer Science. 59. pp. 4-12. DOI: 10.17223/19988605/59/2
7. Kolmanovskiy, V.B. (1996) Ustoychivost' diskretnykh uravneniy Vol'terra [Stability of discrete Volterra equations]. Dokl. RAN.
349(5). pp. 40-61.
8. Kolmanovskiy, V.B. (2000) On the asymptotic properties of solutions of some nonlinear volterra equations. Avtomatika i telemek-
hanika. 4. pp. 42-50.
9. Demyanov, V.F. & Rubinov, A.M. (1990) Osnovy negladkogo analiza i kvazidifferentsial'noe ischislenie [Fundamentals of non-
smooth analysis and quasi-differential calculus]. Moscow: Nauka.
10. Demyanov, V.F. & Malozemov, V.N. (1972) Vvedenie v minimaks [Introduction to minimax]. Moscow: Nauka.
11. Gabasov, R. & Kirillova, F.M. (2011) Printsip maksimuma v teorii optimal'nogo upravleniya [The maximum principle in the theory of optimal control]. Moscow: Librokom.
Информация об авторе:
Чырахова Махнура Узеир кызы - докторант Института систем управлении НАН Азербайджана (Баку, Азербайджан). E-mail: [email protected]
Автор заявляет об отсутствии конфликта интересов.
Information about the author :
Chirakhova Mahnura U. (Post-graduate Student of the Institute of Control System of the National Academy of Sciences of Azerbaijan, Baku, Azerbaijan). E-mail: [email protected]
The author declares no conflicts of interests.
Поступила в редакцию 04.06.2022; принята к публикации 29.11.2022 Received 04.06.2022; accepted for publication 29.11.2022