Научная статья на тему 'Необходимое условие оптимальности в задаче управления с дискретным временем при недифференцируемом критерии качества'

Необходимое условие оптимальности в задаче управления с дискретным временем при недифференцируемом критерии качества Текст научной статьи по специальности «Математика»

CC BY
196
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИСКРЕТНАЯ ЗАДАЧА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ / ПРИРАЩЕНИЕ КРИТЕРИЯ КАЧЕСТВА / НЕОБХОДИМОЕ УСЛОВИЕ ОПТИМАЛЬНОСТИ / ПРОИЗВОДНАЯ ПО НАПРАВЛЕНИЯМ / DISCRETE OPTIMAL CONTROL PROBLEM / INCREMENT THE COST FUNCTIONAL / NECESSARY OPTIMALITY CONDITIONS / DIRECTIONAL DERIVATIVE

Аннотация научной статьи по математике, автор научной работы — Гараева Эсмира Акиф Кызы, Мансимов Камил Байрамали Оглы

Рассмотрена одна дискретная задача оптимального управления с негладким критерием качества. Установлено необходимое условие оптимальности в терминах производных по направлениям.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Гараева Эсмира Акиф Кызы, Мансимов Камил Байрамали Оглы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Necessary optimality condition in one discrete control problem from nondifferentiable control cost

In this article we consider the problem of necessary optimality condition in one discrete control problem but assuming nondifferenti-ability quality functional. We derive a necessary condition for optimality in terms of directional derivatives. Let managed object described by a system of difference equations z(t +1,x) = f (t,x,z(t,x),u(t)), t = t0,t0 + 1,...,t1 -1; x = x0,x0 +1,...,x1, (1) with the initial condition z (t0, x) = y (x), x = x0,x0 + 1,...,x1, (2) where n dimensional vector function y (x) is a solution of y(x +1) = g(xy(x),v(x)), x = x0,x0 +1,...,x1 -Ь y(x0)= y0. (3) Here f (t, x, z,u) (g (x,y,v)) is the given n dimensional vector-function continuous with respect to all variables together with the partial derivatives with respect to z (y), y0 is a given constant vector, t0, t1, x0, x1 are given numbers, the differences t1 -10 and x1 x0 are natural numbers, u (t) (v ( x )) is r(q)-dimensional vector of control actions with values from a specified non-empty, bounded set u(t) e U с Rr, t e T = {t0,t0 +1,...,t1 -1}, v(x) e V сRq, xeX ={x0,x0 +1,...,x1 -1}. (4) Our goal is to minimize the functional.1 -1 S (u,v)=ф1 (y (X1))+ X ф2 (.zX)) under the constraints (1)-(4). Here ф1 (y) (ф2 (x, z)) is the given scalar function satisfying the Lipschitz condition with respect to y (z) and having derivatives with respect to y (z) in any direction.

Текст научной работы на тему «Необходимое условие оптимальности в задаче управления с дискретным временем при недифференцируемом критерии качества»

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2017 Управление, вычислительная техника и информатика № 38

УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ

УДК 517.977

Б01: 10.17223/19988605/38/1

Э.А. Гараева, К.Б. Мансимов

НЕОБХОДИМОЕ УСЛОВИЕ ОПТИМАЛЬНОСТИ В ЗАДАЧЕ УПРАВЛЕНИЯ С ДИСКРЕТНЫМ ВРЕМЕНЕМ ПРИ НЕДИФФЕРЕНЦИРУЕМОМ

КРИТЕРИИ КАЧЕСТВА

Рассмотрена одна дискретная задача оптимального управления с негладким критерием качества. Установлено необходимое условие оптимальности в терминах производных по направлениям.

Ключевые слова: дискретная задача оптимального управления; приращение критерия качества; необходимое условие оптимальности; производная по направлениям.

В работах [1-3] изучена задача оптимального управления, представляющая собой дискретный аналог одной из задач, рассмотренной в работах А.И. Москаленко (см.: [4, 5]) и занимающей промежуточное положение между задачами оптимального управления с сосредоточенными и распределенными параметрами. Установлен аналог дискретного принципа максимума, уравнения Эйлера, выведен аналог линеаризованного условия максимума.

В предлагаемой статье рассматривается задача, аналогичная задаче из [1-3], но при предположении недифференцируемости функционала качества. Выведено необходимое условие оптимальности в терминах производных по направлениям.

1. Постановка задачи

Пусть управляемый объект описывается системой разностных уравнений

+1,х) = /(,х,х),и(г)), г = ^ + " 1; х = хо,хо + 1,..,Х1, (!)

с начальным условием

г(о, х) = у(х), х = Хо, Хо +1,..., хх, (2)

где у(х) - «-мерная вектор-функция, являющаяся решением задачи

у(х +1) = g((x,y(x),v(x)), х = хо,хо +1,...,х1 -1, (3)

У(хо ) = У о.

Здесь /(, х, г, и) ((х, у, у)) - заданная п -мерная вектор-функция, непрерывная по совокупности переменных вместе с частными производными по 2 (у); уо - заданный постоянный вектор; го, г1, хо, х1 - заданные числа, причем разности г1 - го и х1 - хо есть натуральные числа; и (г) (у(х)) -г (д) -мерный вектор управляющих воздействий со значениями из заданного непустого, ограниченного множества и (V), т.е.

и()е и с Яг, г е Т = {го,го + 1,...,гх -1},

у(х)е¥ с Я , х е X = {хо , хо +1,..., х1 -1}. (4)

Пару (и(), у(х)) с вышеперечисленными свойствами назовем допустимым управлением. Рассмотрим задачу о минимуме функционала

Л1 -1

(u,у) = Ф1 (у (х1)) + Ё Ф2 ((2 х)) (5)

при ограничениях (1)-(4). Здесь ф1 (у) (ф2 (х,2)) - заданная скалярная функция, удовлетворяющая условию Липшица по у (г) и имеющая производные по у (г) по любому направлению.

Допустимое управление (и° (t), (х)), доставляющее минимум функционалу (5) при ограничениях

(1)-(4), назовем оптимальным управлением, а соответствующий процесс (и°(t), у°( х), 2°(t, х), у°( х)) -оптимальным процессом.

2. Вспомогательные факты

Пусть (и°(t), у°( х), 2° (t, х), у°(х)) - фиксированный допустимый процесс. Через (и (t) = u° (t) + Аu (t), у( х) = у°( х) + Ду (х), 2 (^ х) = 2 ° (t, х) + Д (t, х), у (х) = у°(х) + Ау (х)) обозначим произвольный допустимый процесс.

Тогда приращение (((, х), Ду(х)) состояния (2 °(t, х), у °(х)) будет решением задачи

Дг^ +1, х) = / (^ х, 2^, х), й(1)) - / (., х, 2° (^ х), и° (t)), (6)

Дz(t0, х) = Ду(х), (7)

Ду(х +1) = я (х, у(х), V (х))- я (х, у°(х), у°(х)), (8)

Ду(хо ) = 0. (9) Используя формулу Тейлора из (6)-(9), получаем, что приращение (Д2(, х), Ду(х)) состояния (2° (/, х), у ° (х)) является решением линеаризованной задачи

Дг (t +1, х) = (t, х)Д2 (t, х) + Д_(()/(t, х) + Г|1 (t, х; Ди), (10)

Дг^, х) = Ду(х), (11)

Ду (х +1) = Я2 (х) Ду (х) + Д_(х)Я (х) +| (х; Ду (х)), (12)

Ду(хо ) = 0, (13)

где по определению

| (, х; Ди ) = Д-(t}У2 (t, х) Д2 (, х) + О1 (\Д2 (, х)||) ,

I (х;Ду (х)) = Д. (х )Яу (х) Ду (х) + °2 (||Ду (х )||) .

Здесь и в дальнейшем для простоты изложений используется обозначения типа

/2 (t, х) = /(t, х, 2°(t, х), и°(t)),

Яу (х ) = я (х, у °(х), у°( х)), Д_}/(t, х) = /(t, х, 2° (t, х), и (t)) - /(t, х, 2° (t, х), и° (t)),

V)Я(х) = я(х,у° (х), V (х)) - я(х,у° (х),у° (х)).

Уравнение (10), (12) можно интерпретировать как линейное неоднородное разностное уравнение относительно Дг^, х) (Ду(х)).

Поэтому на основе формулы о представлении решений линейных неоднородных разностных уравнений (см. например, [6, 7]) решения задач (10), (11) и (12), (13) соответственно можно представить в виде

г-1

Д2(х) = Р(^ -1; х)Д2(tо,х) + ХР(,т; х)ДЧт)/(т,х) + | (,х; Ди()), (14)

т=*0

Av(x) = X 0(x,5) A^)g) + r (x; Av(x)), (15)

s= л^

где по определению

i-1 x—1

Г3 (t,x; Au(t)) = XF(t,x; x)rh (x,x; Au(x)), Г4 (x; Av(x)) = s)r (s; Av(s)) .

T=i„

Здесь F (t, x; x), Ф( s) - (n x n) матричные функции, являющиеся решениями уравнений F (t, x-1, x) = F (t, x; x) f (x, x), F(t, t -1, x) = E, Ф^, s - l)=Ф(x, s )gy (s), Ф(x, x -1) = E, (E - (n x n) единичная матрица). Поскольку Az((o,x) = Ay(x), то, учитывая (15), представление (14) решения Az((,x) задачи (10), (11) записывается в виде

x-1 i-1

Az(t,x) = X F(t,to -1; x^(x,s)A_wg(s) + XF(t,x; x)A_wf (x,x) + r5 (t,x; Au(t),Av(x)), (16)

s=x0 x=to

где по определению

Г5 (t, x; Au (t), Av(x)) = r3 (t, x; Au (t)) + F(t, t0 -1; x)r4 (x; Av(x)).

В дальнейшем нам понадобится оценка нормы приращения траектории. Ясно, что

t x

Az (t +1, x ) = X (Az (x +1, x)- Az (x, x)) + Az (to, x), Ay(x +1) = X (Ay(s +1) - Ay(s)).

x=to s=x0

Отсюда с учетом задач (10)-(13) будем иметь

t

Az(t +1,x) = X[f (x,x,z (x,x),u (x)) - f (x,x,z0 (x,x),u0 (x))J + Ay(x), (17)

x=to

Ay(x +1) = X[g(s,y(s),v(s))-g(s,y0(s),v0(s))] . (18)

s=

Переходя к норме в обоих частях этих соотношений и используя условия Липшица, после некоторых преобразований получим

||Az(t + ^x^Xl^x/(x,x)|| + Ц ^||Az(x,x) + ||Ay(x)||, (19)

x=to x=io

||Ay(x +1)< ¿K)g(s) + L2 ¿|Ay(x). (2o)

Здесь Ц = const > o, i = 1,2, - некоторые постоянные.

Применяя дискретный аналог леммы Гронуолла-Беллмана (см. например, [7, 8]) к неравенству (2o), получим

lA (x)|< L3 X|A(s)g (s)| (Ц3 = const > o) . (21)

s=xo

Далее, учитывая оценку (21) в (2o), а затем применяя лемму Гронуолла-Беллмана приходим к оценке

X|| Au (x)f ( x )Ц + 1| Av (s )g (s )

x=to

(22)

||Az (t, x ))< Ц где L4 = const > o .

3. Необходимое условие оптимальности

Предположим, что множества

f (t, x, z0(t, x),U) = |a: a = f (t, x, z0(t, x), u), u eU J, (23)

я(х,у°(х),У) = {р: р = я(х,у°(х),У), VеУ} (24)

выпуклы.

Перейдем к выводу необходимого условия оптимальности в рассматриваемой задаче. Считая (и° ^),у° (х)) оптимальным управлением, его специальное приращение определим по формуле

Г^ ) = и ^; в)- и °(t), t е Т, (25)

[ДуДх) = 0, хеX,

где ве [0,1] - произвольное число, а и (^ в) е и , / е Т, - произвольная допустимая управляющая функция, такая, что

Аu{ t; В/ ( t , ^ )/ ( t , ^ ) .

Здесь и() - произвольная допустимая управляющая функция, соответствующая и (t; в) . Это возможно в силу выпуклости множества (23). Через (Дгв (t, х), Дув (х)) обозначим специальное приращение траектории (2°(t, х), у°(х)), отвечающее приращению (25) управления (и° ^),у°(х)) . Из оценок (21), (22) сразу следует, что

||Д2в(t, х)|| ~ в , ||Дув (х)|| = 0.

Поэтому из (14) следует, что

4 -1

Д2в (t1, х) = в X Р (1, t) Д^/(, х) + ° (в) .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I=10

Полагая

к -1

£ (и ) = вХ Р (t1, t )ДH{Í)/(, х ) ,

эта формула записывается в виде

Д2в(х) = в£(и) + °(в) . (26)

Вычислим специальное приращение критерия качества (5), соответствующее приращению (25) управления (и° (1),у°(х)) . Имеем

Мв (и°, V° ) = 5 (и° + Д„в , V° ) - 5 (и°,V° ) = X [ф2 (х, 2(1, х) + Д2в (1, х) ) - Ф2 (х, 2 (1, х) ) ] =

х -1

х -1

Х[ф2 (х, 2 (1, х) + в £ (и) + ° (в)) Ф2 (х, 2(1, х)) ] =

X [ф2 (х, 2 х) + в£ (и) + °(в) ) - Ф2 (х, 2 х) + в£ (и) ) -(ф2 (х, 2 (tl, х) +в£ (и) ) -Ф2 (х, 2 (tl, х) ) ) ] .

+

Поскольку Ф2 (х, 2) удовлетворяет условию Липшица по 2 и имеет производные по направлениям, то из последнего соотношения получаем, что вдоль оптимального процесса (и° (^,у° (х) )

X ^2( х,2 (tl,х)) +°(в) > 0. ^ д£(и) v '

в

Отсюда при достаточно малых ве[0,1] следует, что

х-1 дФ2 ( х, 2 (I, х) )

Теперь специальное приращение оптимального управления (и° (^,у° (х) ) определим по формуле

Диц(^ = 0, t е т, Дуц(х) = V(х, ц)- х), х е X. (28)

Здесь це[0,1] - произвольное число, а V (ц, х) - произвольная допустимая управляющая функция, та-

кая, что

^ц) я(х) = цд н я( х),

где у(х) - соответствующая V(х; ц) произвольная управляющая функция.

Через (д^^ , х), Ауц( х) ) обозначим специальное приращение оптимальной траектории, соответствующее приращению (28) управления (и° (^,у° (х)) . Из оценок (21), (22) следует, что

К( t, х) 11~ ц, 1К( х) 11~ ц.

С учетом (29) из представлений (15), (16) следует, что

х—1

Ч (^х) = цХ Р (tl, tо-1;х) ф(x, я (*)+°(ц),

х -1

Дуц(х1) = цxф(xl, х) дч*) я (х) + °(ц).

(29)

(30)

(31)

Полагая

х -1

4 (V, х) = X Р (t1, t0 - 1 х) ф (x, я (*) , 42 (У) = X ф(xl, х) Ду(х) я (х),

представление (30), (31) запишем соответственно в виде

Дуц(х0 = в4 (+ °(ц) , (32)

Д2ц(tl,х) = вд2 (V,х) + °(ц) . (33)

С помощью (32), (33) вычислим специальное приращение функционала качества, соответствующее приращению (28) оптимального управления (и° (/),у° (х)). Имеем

А5ц( и °, V °) = 5 (и °, V °+ДУц)-5 ( и °, V °) = [ф1 ( у °(х^ + у^) )-Ф1 ( у °(х^ )] +

х -1

+ XXX [Ф2 (( 2 (t1, х) + Д2ц (1, х) ) - Ф2 ( 2 (t1, х)) ] = = [ф (у° (Х1) + ц41 (V) + °(ц) ) - ф (у° (Х1) + ц41 (V)) ] + [ф (у° (Х1) + ц41 (у)) - ф (у° (х)) ] -

х -1 |-

-X (ф2 (, 2°(1,х) + ц42 (у,х) + °(ц) ) Ф2 (, 2°(tl, х) + ц42 (V, х) )) +

+ (ф2 (, 2° (tl, х) + ц42 (V, х) ) - Ф2 (, 2° (1, х) ) ) Следовательно, имеет место разложение

Д5ц (и °, V °) = ц

дф1 (у °(х,) ) + ^ дф2 ( х, 2 °(1, х) )

д41 (у) х=х0 д42 (x, Из разложения (34) в силу произвольности ц е [0,1] следует, что

дф (у°(х0) ^ дф2 (х, 2 °(tl, х)) < 0

°(ц) .

(34)

д4 (у)

Сформулируем полученный результат.

д42 (V, х)

Теорема. Пусть множества (23), (24) выпуклы. Тогда для оптимальности допустимого управления (u° (t), v°(x)) необходимо, чтобы неравенства (27) и (35) выполнялись соответственно для всех

u(()e U, t e T, v(x) e V, x e X.

Неравенства (27), (35) являются необходимыми условиями оптимальности первого порядка в терминах, производных по направлениям (см., например, [9-11]).

Замечание. Используя необходимые условия оптимальности (27), (35), можно получить необходимые условия оптимальности в задаче на минимакс (см., например, [Ю, 11]). Из них следует также аналог дискретного условия максимума.

Заключение

Для одной специфической негладкой задачи оптимального управления дискретными системами при помощи аналога метода явной линеаризации получено необходимое условие оптимальности первого порядка в терминах производных по направлениям. Полученный результат может быть применен для исследования задачи на минимакс для рассматриваемой системы.

ЛИТЕРАТУРА

1. Гараева Э.А., Мансимов К.Б. Об одной дискретной задаче оптимального управления // Вестник БГУ. Сер. физ.-мат. наук.

2o14. № 1. С. 35-41.

2. Гараева Э.А., Мансимов К.Б. Необходимые условия оптимальности в одной дискретной задаче оптимального управления //

Материалы Международной конференции, посвященной 55-летию ИМ и М НАН Азербайджана. Баку, 2o14. С. 236-238.

3. Гараева Э.А., Мансимов К.Б. Об одной дискретной задаче оптимального управления // Вестник БГУ. Сер. физ.-мат. наук.

2o14. № 1. С. 15-21.

4. Москаленко А.И. Об одном классе задач оптимального регулирования // Журнал вычислительной математики и мат.-физики.

1969. № 1. С. 69-95.

5. Москаленко А.И. Некоторые вопросы теории оптимального управления : автореф. дис. ... канд. физ.-мат. наук. Томск, 1971.

2o с.

6. Габасов Р., Кириллова Ф.М. Оптимизация линейных систем. Минск : Изд-во БГУ, 1973.

7. Мансимов К.Б. Дискретные системы. Баку : Изд-во Бакин. гос. ун-та, 2o13. 131 с.

8. Васильев Ф.П. Методы решения экстремальных задач. М. : Наука, 1981. 4oo с.

9. Демьянов В.Ф. Минимакс: Дифференцируемость по направлениям. Л. : Изд-во ЛГУ, 1974. 112 с.

10. Демьянов В.Ф., Виноградова Т.К. и др. Задачи теории оптимизации и управления. Л. : Изд-во ЛГУ, 1982. 324 с.

11. Демьянов В.Ф., Рубинов А.М. Основы негладкого анализа и квази-дифференциальное исчисление. М. : Наука, 199o. 482 с.

Гараева Эсмира Акиф кызы. E-mail: esmira.qarayeva@mail.ru Институт систем управления НАН Азербайджана (г. Баку)

Мансимов Камил Байрамали оглы, д-р физ.-мат. наук, профессор. E-mail: mansimovbkamil@gmail.com Бакинский государственный университет

Поступила в редакцию 24 сентября 2o16 г.

Garaeva Esmira A. (Institute of Control Systems of NAS Azerbaijan, Baku, Azerbaijan). Mansimov Kamil B. (Baku State Universitety, Baku, Azerbaijan).

Necessary optimality condition in one discrete control problem from nondifferentiable control cost.

Keywords: discrete optimal control problem; increment the cost functional; necessary optimality conditions; directional derivative. DOI: 1o.17223/199886o5/38/1

In this article we consider the problem of necessary optimality condition in one discrete control problem but assuming nondifferenti-ability quality functional. We derive a necessary condition for optimality in terms of directional derivatives. Let managed object described by a system of difference equations

z(t +1,x) = f (t,x,z(t,x),u(t)) , t = to,to + 1,...,t1 -1; x = xo,xo +1,...,x1, (1)

with the initial condition

z (to, x) = y (x), x = xo,xo + 1,...,x1, (2)

where n - dimensional vector function y (x) is a solution of

y(x +1) = g(xy(x),v(x)), x = xo,xo +1,...,x1 -Ь y(xo)= yo. (3)

Here f (t, x, z,u) (g (x,y,v)) is the given n - dimensional vector-function continuous with respect to all variables together with the partial derivatives with respect to z (y), y0 is a given constant vector, t0, tJ, x0, xj are given numbers, the differences tJ -t0 and xj - x0 are natural numbers, u (t) (v (x)) is r(q)-dimensional vector of control actions with values from a specified non-empty, bounded set

u(t) e U c Rr , t e T = {t0,t0 + J,...,tj - j},

v (x) e V c Rq , x e X ={x0, x0 + J,..., xJ - J} . (4)

Our goal is to minimize the functional

xj -J

S(u,v) = 9j (y(xj))+ X <p2 ((;z(tJ,x))

under the constraints (J)-(4).

Here 9J (y) (x, z)) is the given scalar function satisfying the Lipschitz condition with respect to y (z) and having derivatives with respect to y (z) in any direction.

REFERENCES

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

J. Garayeva, E.A. & Mansimov, K.B. (20J4) On a discrete optimal control problem. Vestnik BGU. Ser. fiz.-mat. Nauk - Baku University News Journal. Ser. Physics and Mathematics. J. pp. 35-4J. (In Russian).

2. Garayeva, E.A. & Mansimov, K.B. (20J4) [Necessary conditions for optimality in a discrete optimal control problem]. Materials of

the International Conf. Dedicated. to the 55th Anniversary ofMI and M National Academy of Sciences ofAzerbaijan. Baku. MI and M the Azerbaijan National Academy of Sciences. pp. 236-238. (In Russian).

3. Garayeva, E.A. & Mansimov, K.B. (20J4) On a discrete optimal control problem. Vestnik BGU. Ser. fiz.-mat. Nauk - Baku University

News Journal. Ser. Physics and Mathematics. J. pp. J5-2J. (In Russian).

4. Moskalenko, A.I. (J969) Ob odnom klasse zadach optimal'nogo regulirovaniya [On a class of optimal control problems]. Zhurnal

vychislitel'noy matematiki i mat.-fiziki - Computational mathematics andMatthematical Physics. J. pp. 69-95.

5. Moskalenko, A.I. (J97J) Nekotorye voprosy teorii optimal'nogo upravleniya [Some questions in the optimal control theory]. Abstract

of Physics and Mathematics Cand. Diss. Tomsk.

6. Gabasov, R. & Kirillova, F.M. (J973) Optimizatsiya lineynykh sistem [Optimization of linear systems]. Minsk: Belarusian State Uni-

versity.

7. Mansimov, K.B. (20J3) Diskretnye sistemy [Discrete Systems]. Baku: Baku State University.

8. Vasiliev, F.P. (J98J) Metody resheniya ekstremal'nykh zadach [Methods for solving extreme problems]. Moscow: Nauka.

9. Demianov, V.F. (J974) Minimaks: Differentsiruemost'po napravleniyam [Minimax: differentiable in the direction]. Leningrad: Len-

ingrad State University.

J0. Demianov, V.F. et al. (J982) Zadachi teorii optimizatsii i upravleniya [The tasks of the theory of optimization and management].

Leningrad: Leningrad State University. JJ. Demianov, V.F. & Rubinov, A.M. (J990) Osnovy negladkogo analiza i kvazi-differentsial'noe ischislenie [Fundamentals of non-smooth analysis and quasi-differential calculus]. Moscow: Nauka.

J0

i Надоели баннеры? Вы всегда можете отключить рекламу.