Нелокальное улучшение управлений в нелинейных дискретных системах

Моржин Олег Васильевич

Онлайн-доступ к журналу: http://isu.ru/izvest.ia.

Серия «Математика»

2017. Т. 19. С. 150-163

УДК 517.977 MSG 49J21, 93С10

DOI https://doi.org/10.26516/1997-7670.2017.19.150 Нелокальное улучшение управлений в нелинейных дискретных системах

О. В. Моржин

Институт проблем управления им. В. А. Трапезникова РАН

Аннотация. Рассматривается нелинейная задача, оптимального управления дискретной системой, содержащая как управляющую функцию, так и управляющие параметры (параметры входят в правую часть системы и начальное условие). Для данной оптимизационной задачи исследуется задача, улучшения управления. Развивается известный подход к нелокальному улучшению управления, базирующийся на. построении точной (без остаточных членов разложений по переменным состояния и управления) формулы приращения целевого функционала, при специальной сопряженной системе.

Для данной нелинейной оптимизационной задачи рассмотрен обобщенный лагранжиан, следуя теории В. Ф. Кротова.. Функция сp(t, х), играющая важную роль в обобщенном лагранжиане, рассматривается в статье в линейном по х виде tp(t,x) = = (p(t),x), где функция p(t) является решением указанной сопряженной системы. Таким образом, во-первых, точная формула, приращения целевого функционала, рассматривается в предположении существования решения p(t)\ и, во-вторых, линейная функция tp(t, х) здесь использована, в связи с получением указанной формулы приращения, а. не для линейной аппроксимации приращения обобщенного лагранжиана.. Сформулировано соответствующее условие улучшения управления в терминах краевой задачи, образованной объединением системы, данной в оптимизационной задаче, вместе с сопряженной системой. Полученное условие улучшения аналогично условиям улучшения, ранее предложенным в работах автора, для дискретных задач без управляющих параметров.

Приведен иллюстративный пример улучшения управления в задаче, в которой подлежащее улучшению управление дает максимум функции Понтрягина. при всех значениях t. Краевая задача, улучшения решена, с помощью метода, пристрелки, причем вычисления осуществлены аналитически.

Ключевые слова: дискретные системы, оптимальное управление, управляющие функции и параметры, нелокальное улучшение.

НЕЛОКАЛЬНОЕ УЛУЧШЕНИЕ УПРАВЛЕНИЙ В НЕЛИНЕЙНЫХ ... 151 1. Введение. Постановка задачи

Статья посвящена памяти Владимира Иосифовича Гурмана [12], известного ученого, замечательного человека. Владимир Иосифович Гурман вместе с Вадимом Федоровичем Кротовым [18] являются авторами ряда основополагающих результатов в оптимальном управлении: в том числе, достаточных условий оптимальности [13; 14; 15; 16; 19; 20]. Автору посчастливилось слушать лекции Владимира Иосифовича, а затем совместно работать с Владимиром Иосифовичем и Вадимом Федоровичем.

Гассматривается дискретная задача оптимального управления с управляющей функцией и параметрами:

tF-1

1(a) = F{x{tF),w) + /° (t, x{t),u{t),w) ->■ inf, t=ts

x(t + 1) = / (t, x(t),u(t),w) , x(ts0 = a,

u(t) € [/ С Em, ten = {ts, ts + 1,..., tF - 1}, w € W С Ez, a G A Ç En,

где x(t) = (x\(t), ...,xn(t)) и u(t) = (v,\(t), ...,um(t)) - значения функции состояния и управляющей функции при t € T = {ts,ts + 1,...,îf} и t € Т\ соответственно; w = (w\,..., wz) и а = (а\,...,ап) - векторные управляющие параметры; моменты ts, tF заданы; набор

а = (x(t) | t еТ, u(t) I t € Ть w, a)

представляет собой процесс управляемой системы. Предполагаем непрерывную дифференцируемость функции F(x) по х, непрерывную дифференцируемость функций f°(t,x,u,w), f(t,x,u,w) по (х, и, w). Множества U, W, А будем считать замкнутыми и выпуклыми (в дальнейшем будем рассматривать проекции на эти множества). В качестве допустимых процессов рассматриваем такие процессы а, которые удовлетворяют (1.2), (1.3). Через D обозначим множество допустимых процессов <т; через V - множество допустимых функций и(-).

В данной статье рассматривается задача улучшения заданного процесса d1 € D, состоящая в нахождении процесса <тп € D такого, что Д/(<тп) = 1(яи) - 1(<т1) < 0. В случае А 1(<т11) < 0 говорим о строгом улучшении и1 на процессе <тп. Последовательное решение задач

улучшения дает улучшающую последовательность {ак}, к = 0,1,...

* * *

Вообще говоря, разработка теории и методов решения задач оптимального управления различного вида системами ведется в течение нескольких десятилетий, включая формулировку JI. С. Понтрягиным

(1.1)

(1.2) (1.3)

152

О. В. МОРЖИН

принципа максимума [25]. В том числе, исследование дискретных задач оптимального управления имеет давнюю историю. В 1959 г. Л. И. Розо-ноэром [27] был получен аналог принципа максимума Понтрягина для линейных по состоянию дискретных систем с управляющими функциями. Как известно, для нелинейных дискретных задач оптимального управления принцип максимума имеет ограниченное применение по сравнению с аналогом, известным для непрерывных задач [26; 11; 24]. Так, в 1963 г. А. Г. Бутковским [10, с. 181] построен пример, в котором функция Понтрягина на оптимальном процессе имеет лишь локальный максимум.

Существуют методы решения задач оптимального управления, основанные на аппроксимациях 1-го и 2-го порядков для приращений целевых функционалов задач оптимального управления. С другой стороны, известны методы улучшения управлений, основанные на построении точных (без остаточных членов разложений) формул приращения целевых функционалов.

Разработке теории и методов улучшения управлений на основе точных формул приращения посвящены работы ряда ученых. В предыдущие годы в работах В. А. Срочко, А. С. Булдаева и учеников были построены нелокальные методы на основе построения точных формул приращения для линейно-квадратичных, квадратичных, полиномиальных задач оптимального управления системами, описываемыми обыкновенными дифференциальными уравнениями [2; 28; 5].

В работах [6; 7; 8; 21; 22; 9] А. С. Булдаева и учеников был предложен и получил развитие подход к нелокальному улучшению управлений для достаточно общих нелинейных задач оптимального управления системами, описываемыми дифференциальными уравнениями, на основе построения точных формул приращения целевых функционалов при специальных сопряженных системах, включая формулировку усиленных необходимых условий оптимальности. Части статей [21; 22] и работа [23] посвящены данному подходу применительно к дискретным системам, и данная статья дополняет указанные публикации.

В работе [17] В. А. Дыхтой для достаточно общих нелинейных задач оптимального управления системами, описываемыми обыкновенными дифференциальными уравнениями, получены варианты достаточных условий сильного и глобального минимума для экстремалей Понтрягина на основе точной формулы приращения целевого функционала. В статье [29] В. А. Срочко и В. Г. Антоником на основе точных формул приращения получены достаточные условия оптимальности экстремальных управлений, дополняющие принцип максимума Понтрягина в билинейной и квадратичной задачах оптимального управления системами, описываемыми обыкновенными дифференциальными уравнениями.

Что касается задач оптимального управления системами с распределенными параметрами, отметим статью [3] А. В. Аргучинцева, В. П. Поплевко, в которой для одной задачи оптимального управления гиперболическими системами первого порядка была сформулирована теорема о необходимых и достаточных условиях оптимальности. В работе [3] показано, в частности, улучшение особого управления.

Таким образом, построение точных формул приращения целевых функционалов дает возможность сформулировать необходимые и достаточные условия оптимальности управлений, а также разработать новые эффективные методы улучшения управлений для различных задач оптимального управления.

* * *

Цель данной статьи - описание подхода к нелокальному улучшению управлений в задаче (1.1) - (1-3) на основе построения точной формулы приращения целевого функционала в данной задаче. В разделе 2 приведены специальная сопряженная система, точная формула приращения, соответствующее условие улучшения управления. Раздел 3 посвящен иллюстративному примеру.

2. Условие улучшения управлений

Следуя теории [20; 13; 30], рассмотрим обобщенный лагранжиан

tF-1

Цо) = G{x{tF),w, a) - Y^ x(t),u(t),w), (2.1)

t=ts

G{x{tF),w, a) = F{x{tF),w) + ip(tF, x(tF)) - <p(ts, x(ts)), ^ 2ч R(t,x,u,w) = ip(t + 1, f(t,x,u,w)) — ip(t,x) — f°(t,x,u,w), ^ ' '

где x(ts) = а; функция ip(t, x) не задана, и далее будет указан класс функции tp(t,x).

Рассмотрим приращение функционала (2.1): AL(a) = L(a) — L(al), где и1 € D - процесс, подлежащий улучшению; а € D - некоторый произвольный процесс из D.

Как известно, одним из способов задания функции ip(t, х) в различных классах задач оптимального управления является линейная форма [1; 30]. В связи с (2.1), (2.2) рассмотрим

<p(t,x) = (p(t),x), p(t) € Еп, te{ts,ts + l,...,tF}, (2.3)

где предполагается существование функции p(t), удовлетворяющей представленным далее конструкциям. Следуя [22], сформулируем

Утверждение 1 (сопряженная система и формула приращения). В предположении существования функции p(t), удовлетворяющей специальной дискретной сопряженной системе

p(t) = Hx(t,p(t + l),xl(t),ul(t),wl)+r(t), p(tF) = -Fx(x\tF),wl)-q,

F(x(tF),w1)-F(x1(tF),w1) = , .

= (Fx(xl(tF),wl),Ax(tF)) + {q,Ax(tF)), ^

F(x(tF),w) - F(x(tF),wl) = (Fw(x(tF),wl) + I, Aw), (2.6)

H(t,p(t + 1 ),x(t),ul(t),wl) - H(t,p(t + 1), xl(t), ul(t), w1) =

= {Hx(t,p(t + l),xl(t),u\t),wl) + r(t),Ax(t)}, 1 J)

H(t,p(t + l),x(t),u(t),wl) - H(t,p(t + l),x(t),ul(t),wl) = . ,

= (Hu(t,p(t + l),x(t),uI(t),wI) + d(t),Au(t)), [ ' J

H{t,p{t + l),x{t),u{t),w) - H{t,p{t + l),x{t),u{t),wl) = = (Hw(t,p(t + l),x(t),u(t),wl) +b, Aw),

приращение AI (a) = AL(a) на D принимает вид

(2.9)

A 1(a) = <Fw(x(tF),w1)+l-tF-1

- (Hvit^^ + l)^^),^^)^1)+d(t),Au(t))-t=ts

tF-i

- {Hw(t,p(t + l),x(t),u(t),w1)+b),Aw)-(p(ts),Aa), (2.10) t=Ts

где функция Понтрягина H(t,p,x,u,w) = (p, f(t,x,u,w)) — f°(t,x,u,w); «добавки» I € Ez, q € En, b € Ez, d(t) € Em, r(t) € En; Ax = x - x1, Aw = w — w1 и т.д.

Замечание 1. Точная формула приращения (2.10) сформулирована при линейной функции ip(t, х) в предположении существования решения p(t) специальной сопряженной системы (2.4) - (2.9). Таким образом, линейная функция <p(t,x) здесь использована не для линейной аппроксимации приращения целевого функционала, а для получения точной формулы приращения в нелинейной задаче (1.1) - (1-3).

Поясним, что сопряженная система (2.4) - (2.9) сформулирована в связи с преобразованием конструкций (2.1), (2.2) при <p(t,x) = (p(t),x):

AG(tF, x(tF),w, a) = F(x(tF),w) — F(x1(tF),w1) +

+ (p(tF),Ax(tF)) - (p(ts),Aa) = [F(x(tF),w) - F(x(tF),w1)] +

+ [F(x(tF), w1) - Fix^tp)^1) + (p(tF), A x(tF))] - (p(ts), A a) = = {Fw{x{tF),wl)+l, Aw) + (F^x^tp^w1) + q+p(tF),Ax(tF))~

- ip(ts),Aa),

AR(t,x(t),u(t),w) = H(t,p(t), x(t), u(t), w) —

— H(t,p(t),xl(t),vl(t),wl) + {p(t),Ax(t)} = = [H{t,p{t + l),x{t),u{t),w) - H{t,p{t + l),x{t),u{t),w1)] + + [H{t,p{t + 1), x(t), u(t), w1) - H(t,p(t + 1), x(t), u\t), w1)] + + [H{t,p{t + 1), x{t), u\t), wl) - H{t,p{t + 1), xl{t), u\t), wl) + + (p(t), Ax(t))] = (Hw(t,p(t + 1), x(t), u(t), w1) + b, Aw)+ + (Hu(t,p(t + l),x(t),u\t),w1) + d(t),Au(t)) +

+ (Hx(t,p(t + l),xl(t),ul(t),wl) + r(t) +p(t),Ax(t)),

где t € Ti.

Далее, в плане построения условия улучшения на основе формулы приращения (2.10) сформулируем мажорирующую оценку для приращения Д/(<7адм), где процесс

{t) 11 e T, Ua (t) I t € Ti, Wß, aß),

xa,ß,ß(t) (t € T) - решение системы (1.2), рассмотренной в виде

{t + l) = f{t

1 xa,ß,ß\ij) Ua(l, xaß;jtt Xa,ß,ß(ts) =aß,

где проекционные зависимости

=Ua(t,Xaßiß(t)) =

= Pи (u\t) + a(Hu(t,paß>ß(t + 1), xaAll(t), u\t), w1) + d(i))), (2.12)

t еть

W/3 = Pvf^iü1 +/3x

x( £ {Hw{t

(t + l)

(t)),wl) + b)~ (2.13)

t=tS

-Fw(xa>ß>ß(tF),wl) - l)j, aß = PA (а1 + fi Pa,ßAfs)) (2-14)

при а: > 0, ß > 0, /х > 0. Здесь pa,ß,ii{t) означает функцию, удовлетворяющую сопряженной системе (2.4) - (2.9) при а = нижние индексы подчеркивают зависимость от а, /3, ц,. Pf/ - оператор проектирования на замкнутое выпуклое множество U.

Утверждение 2 (мажорирующая оценка). Справедлива оценка

< - ^Ц2 - -||ам - а1!!2-

! ъ-? т ^ (2.15)

— е \\иа^)-и\щ2 < о,

а 4=4|д

где а > 0, /3 > 0, ц > 0.

Поясним, что зависимости (2.12) - (2.14) образованы на основе следующей оценки для (2.10) в предположении разрешимости сопряженной системы (2.4) - (2.9):

1 .

А1(а) = -б{Р{ Е {Н^,р(1),х(1),и(1),гю1)+Ъ)-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

' t=ts

-^(ж(^),«;1) Дад)-

П/ г ^ х '

1..... 1

- (/х , Да) = - - ( (ад1 + (3 ( ^ (Яш , , х{1), , ад1) + Ъ) -

- Р^х^р),™1) - - ю1, Аю^-1 \

- - ((а1 + /х р(£<?)) - а1, Аа> < ц.

< --д(рж(ад1 + /?({Кш{1,р{1),х{1),и{1),ь)1) + 6)-

1 tF- 1

- - ^(а1 + /х <?)) - а1, Аа^,

где а > 0, /3 > 0, ц, > 0. Подчеркнем, что процесс ааопределяется через введенные в рассмотрение проекционные зависимости с целью формулировки мажорирующей оценки (2.15), которая, в свою очередь, позволяет сформулировать условие улучшения процесса а1.

Утверждение 3 (условие улучшения в форме краевой задачи). Для улучшения заданного процесса а1 € D в задаче (1.1) - (1.3) достаточно решить краевую задачу, образованную (2.11) вместе с уравнениями

Ра,/3,^) = Hx(t,Pail3,lJ,(t+ l),®1^),«1^),™1) +r(t), ,2

Ра,1зА1Р) = -Fx{xl{tF),wl) - q,

F{xa^itJ,{tF),wl) - F{xl{tF),wl) = , ,

a,

(Fw(x a,

H(t,pa>p>ti(t + l),xa>p>ti(t),ul(t),w1)-H(t,pa>i3>tl(t + l),xl(t),ul(t),wl) = (2.19)

a,

H(t,pa>p>ti(t + 1 ),xa>p>ti(t),iïa(t, xa>p>ti(t)),w1)-

H{t,Pa,P,tJ.{t + l),XaipitJ,{t),Ul{t),Wl) = ,22Qx

= {Hu(t,pai^t + l),xa^ill{t),ul{t),wl) + d{t),

Aua(t,Xa,p^(t))},

H(t,pa^^(t + l),xa^^(t),ùa(t,xa^^(t)),wl) = (2.21)

= (Hw{t ) Pot,p,Il (t + 1)

(t)),wl)+b,Awfi),

при, зависимостях (2.12) - (2.14) с фиксированными а > 0, /3 > О, ц > 0.

3. Иллюстративный пример

Рассматривается задача, известная по [16, с. 111-113], [4, с. 137-138]:

2

/(<7) = Х>2(*)-Ж2(*))-ИП£,

4=0

ж(£ + 1) =х($) + и($), ж(0) = 0, и^еЕ1, г € {0, 1, 2}.

Здесь управление представлено функцией «(£), £ € {0, 1, 2}, управляющих параметров нет.

Требуется улучшить управление = 0, на котором 1{сг1) = 0. Функция ж, и) = р{х + и) —и2 + ж2.

Сопряженная система = ф{1 + 1) + 2ж(£), ^(З) = 0 дискретного принципа максимума [26] на улучшаемом управлении имеет решение ф1^) = 0. На паре (ж1,^1) функция

ф1(ь +1), х1 (ь), и(ь)) = -и2{г)

принимает максимальное значение при всех t € {0,1,2}.

Применим описанный в данной статье способ улучшения. Индекс а при ха и т.п. будем опускать для простоты изложения.

Образуем зависимость иа (t,p(t + 1), x(t)) = a (p(t + 1) + d(t)), где а > 0, d(t) удовлетворяет уравнению вида (2.8), t € {0,1,2}. Краевая задача улучшения имеет вид:

x{t + 1) = x{t) + a (p(t + 1) + d(t)), ж(0) = О, p(t)=p(t + l)+r(t), р(3) = О, r{t)x{t) = x2(t), u{t) (p{t + 1) - u{t)) = (p{t + 1) + d{t)) u{t).

Получаем f(t,p(t + l),a;(i)) = x(t),

— a

d(t) = -u(t), d (t,p(t + 1 ),x(t)) =--—p(t + 1),

a + 1

va{t,p{t + l),x{t)) = ^—p{t + l).

a + 1

Таким образом, приходим к краевой задаче

Гц

x(t + l)=x(t) +-p(t + 1), ж(0)=0,

а + 1

p(t)=p(t + l)+x(t), р(3)=0. В силу p(t + 1) = p(t) — x(t) преобразовываем краевую задачу:

(X

x(t + 1) = x(t) +-\p(t) - x(t)}, ж(0) = О,

а + 1

p(t + l) =p(t) -x(t), p(3)=0.

В полученной краевой задаче применим метод пристрелки, введя начальное условие р(0) = Имеем выражения для значений функций x(t), p(t) и u(t) в зависимости от параметров а и представленные в таблице 1.

Таблица 1.

t x(t] а) p(t]C,a) ua(t;0

0 0 е а{ а + 1

1 е а{

ск + 1 (а + 1)2

2 a2i + 2 ai (а + 1)2 е а + 1 а{(1 — а — а2) (а + 1)3

3 2а2{ + За{ (а + 1)3 {(1 - а-а2) (а + 1)2 —

Условие р{3; а) =0 выполняется при £ = 0 или а2 + а — 1 = 0. Поскольку при £ = 0 строгое улучшение не происходит, то, положив

£ ф 0, решаем уравнение. Находим а = -

> 0. Со значением

а

-1 +

управление =

а

а + 1

р(г + 1;С,ск) при г € {0,1,2}:

- 1

и{ 0;£) =

+ 1

При £ € {0,1, 2} находим

-1)

+ 1)5

и{ 2; 0 = 0.

ж(0;0 = 0, ж(1;0 =

- 1

+ 1

+з)е

В результате 1(а11) = -С< 1(а1) = 0, где С и 0.3, £ ф 0.

4. Заключение

Статья посвящена актуальному направлению по разработке нелокальных методов в нелинейных задачах оптимального управления.

Для задачи (1.1) - (1.3) в статье [22] кратко приведены формула приращения (2.10) и сопряженная система (2.4) - (2.9) без формулировки мажорирующей оценки (2.15) и условия улучшения управлений. В публикациях [21; 23] рассматривается дискретная задача без управляющих параметров. Таким образом, данная статья дополняет указанные публикации автора. Изложенные в статье результаты представляют интерес для дальнейшего развития.

Список литературы

1. Антипина Н. В. Линейные функции Ляпунова-Кротова и достаточные условия оптимальности в форме принципа максимума / Н. В. Антипина, В. А. Дыхта // Изв. вузов. Математика. - 2002. - № 12. - С. 11-22.

2. Аргучинцев А. В. Оптимальное управление: нелокальные условия, вычислительные методы и вариационный принцип максимума / А. В. Аргучинцев, В. А. Дыхта, В. А. Срочко // Изв. вузов. Математика. — 2009. - № 1. - С. 3-43.

3. Аргучинцев А. В. Оптимальное управление начальными условиями канонической гиперболической системы первого порядка на основе нестандартных формул приращения / А. В. Аргучинцев, В. П. Поплевко // Изв. вузов. Математика. - 2008. - № 1. - С. 3-10.

4. Батурин В. А. Приближенные методы оптимального управления, основанные на принципе расширения / В. А. Батурин, Д. Е. Урбанович. - Новосибирск : Наука, 1997. - 175 с.

160

5.

6.

7.

8.

9.

10.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

11.

12.

13.

14.

15.

16.

17.

18.

19.

20.

21.

22.

23.

О. В. МОРЖИН

Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем / А. С. Булдаев. - Улан-Удэ : Изд-во Бурят, гос. ун-та, 2008. - 256 с.

Булдаев А. С. Новый подход к оптимизации управляемых систем на основе краевых задач / А. С. Булдаев // Автоматика и телемеханика. - 2011. - № 6. - С. 87-94.

Булдаев А. С. Модификация метода проекций для улучшения нелинейных управлений / А. С. Булдаев, О. В. Моржин // Вестн. Бурят, гос. ун-та. -2010. - Вып. 9 : Математика и информатика. - С. 10-17.

Булдаев А. С. Улучшение управлений в нелинейных системах на основе краевых задач / А. С. Булдаев, О. В. Моржин // Изв. Иркут. гос. ун-та. Сер. Математика. - 2009. - Т. 2, № 1. - С. 94-107.

Булдаев А. С. Метод неподвижных точек в задачах параметрической оптимизации систем / А. С. Булдаев, И.-Х. Д. Хишектуева // Автоматика и телемеханика. - 2013, № 12. - С. 5-14.

Бутковский А. Г. Теория оптимального управления системами с распределенными параметрами / А. Г. Бутковский. - М. : Наука, 1965. - 476 с. Габасов Р. Качественная теория оптимальных процессов / Р. Габасов, Ф. М. Кириллова. - М. : Наука, 1971. - 508 с.

Гурман Владимир Иосифович / Википедия - свободная энциклопедия [Электронный ресурс]. URL: https ://ru. wikipedia. org/wiki/Гурман, _Владимир_ Иосифович (дата обращения: 2 янв. 2017).

Гурман В. И. Принцип расширения в задачах управления / В. И. Гурман. -2-е изд. - М. : Наука : Физматлит, 1997. - 288 с.

Гурман В. И. Новые методы улучшения управляемых процессов / В. И. Гурман, В. А. Батурин, Е. В. Данилина и др. - Новосибирск: Наука, 1987. -184 с.

Методы улучшения в вычислительном эксперименте / В. И. Гурман [и др.]. -Новосибирск: Наука, 1988. - 184 с.

Гурман В. И. Приближенные методы оптимального управления / В. И. Гурман, В. А. Батурин, И. В. Расина. - Иркутск : Изд-во Иркут. ун-та, 1983. -180 с.

Дыхта В. А. Позиционные усиления принципа максимума и достаточные условия оптимальности / В. А. Дыхта // Тр. ИММ УрО РАН. - 2015. - Т. 21, № 2. - С. 73-86.

Кротов Вадим Федорович [Электронный ресурс] // Википедия - свободная энциклопедия. - URL: https: //ru. wikipedia. org/wiki/Кротов,_Вадим_Фёдо-рович (дата обращения: 2 янв. 2017).

Кротов В. Ф. Новые методы вариационного исчисления в динамике полета / В. Ф. Кротов, В. 3. Букреев, В. И. Гурман. - М. : Машиностроение, 1969. -288 с.

Кротов В. Ф. Методы и задачи оптимального управления / В. Ф. Кротов, В. И. Гурман. - М.: Наука, 1973. - 448 с.

Моржин О. В. Нелокальное улучшение нелинейных управляемых процессов на основе достаточных условий оптимальности / О. В. Моржин // Автоматика и телемеханика. - 2010. - № 8. - С. 24-37.

Моржин О. В. Нелокальное улучшение управляющих функций и параметров в нелинейных динамических системах / О. В. Моржин // Автоматика и телемеханика. - 2012. - № 11. - С. 76-95.

Моржин О. В. Нелокальные улучшения управлений в нелинейных дискретных задачах оптимального управления / О. В. Моржин // XII Всероссийское

совещание по проблемам управления (ВСПУ-2014) : сб. тр. - М. : Изд-во ИПУ РАН, 2014. - С. 650-658. - URL: http://vspu2014.ipu.ru/prcdngs

24. Пантелеев А. В. Теория управления в примерах и задачах / А. В. Пантелеев, А. С. Бортаковский. - М. : Высш. шк., 2003. - 583 с.

25. Математическая теория оптимальных процессов / Л. С. Понтрягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко. - 4-е изд., стер. - М. : Наука, 1983. - 393 с.

26. Пропой А. И. Элементы теории оптимальных дискретных процессов / А. И. Пропой. - М. : Наука, 1973. - 256 с.

27. Розоноэр Л. И. Принцип максимума Л. С. Понтрягина в теории оптимальных систем. I — III / Л. И. Розоноэр // Автоматика и телемеханика. - 1959. - Т. 20, № 10-12. С. 1320-1334, 1441-1458, 1561-1578.

28. Срочко В. А. Итерационные методы решения задач оптимального управления / В. А. Срочко. - М. : Физматлит, 2000. - 160 с.

29. Срочко В. А. Условия оптимальности экстремальных управлений для билинейной и квадратичной задач / В. А. Срочко, В. Г. Антоник // Изв. вузов. Математика. - 2016. № 5. - С. 86-92.

30. Krotov V. F. Global methods in optimal control theory / V. F. Krotov. - New York: Marcel Dekker, 1996. - 408 p.

Моржин Олег Васильевич, кандидат физико-математических наук, старший научный сотрудник, Институт проблем управления им. В. А. Трапезникова РАН, 117997, г. Москва, ул. Профсоюзная, 65, www.ipu.ru/staff/oleg_morzhin (e-mail: [email protected])

O. V. Morzhin

Nonlocal Improvement of Controls in Nonlinear Discrete Systems

Abstract. A nonlinear optimal control problem for discrete system with both control function and control parameters (parameters are at the system's right side and at the initial condition) is considered. For the given optimization problem, the problem of control's improvement is studied. It's developed a known approach for non-local improvement of control based on construction of the exact (without residual terms w.r.t. state and control variables) formula for the cost functional's increment under some special conjugate system.

For the given optimization problem, it's considered the generalized Lagrangian following to the theory by V. F. Krotov. The function ip{t, x) which plays an important role in the generalized Lagrangian is considered in this article in the linear w.r.t. x form ip{t,x) = (p(t),x} where the function p(t) is the solution of the mentioned conjugate system. Thus, first of all, the exact formula of the cost functional's increment is considered under the assumption on the solution p(t) existence; and, secondly, the linear function ip{t, x) is used here in connection with creation of the mentioned increment formula, and not for linear approximation of the generalized Lagrangian's increment. The corresponding condition of control's improvement is formulated in terms of the boundary value problem composed due to binding of the system given in the optimization problem together with the conjugate system. The obtained increment condition is similar to the increment conditions which were suggested before in the papers of the author for discrete problems without control parameters.

162

О. В. МОРЖИН

There is an example of control's improvement in some problem where the control to be improved gives the maximum of the Pontryagin's function for all values of t. The boundary value improvement problem is solved with help of the shooting method, and the calculations are made analytically.

Keywords: discrete systems; optimal control; control functions and parameters; nonlocal improvement.

References

1. Antipina N.V., Dykhta V.A. Linear Lyapunov-Krotov functions and sufficient conditions for optimality in the form of the maximum principle. Russ. Math., 2002, vol. 46, no 12, pp. 9-20.

2. Arguchintsev A.V., Dykhta V.A., Srochko V.A. Optimal control: nonlocal conditions, computational methods, and the variational principle of maximum. Russ. Math., 2009, vol. 53, issue 1, pp. 1-35. https://doi.org/10.3103/S1066369X09010010

3. Arguchintsev A.V., Poplevko V.P. Optimal control of the initial conditions of a first-order canonical hyperbolic system on the basis of nonstandard increment formulas. Russ. Math., 2008, no 1, pp. 3-10.

4. Baturin V.A., Urbanovich D.E. Priblizhennye metody optimal'nogo upravleniya, osnovannye na principe rasshireniya [Approximate optimal control methods based on the extension principle]. Novosibirsk, Nauka, 1997. 175 p. (In Russian).

5. Buldaev A.S. Metody vozmushchenij v zadachah uluchsheniya i optimizacii upravlyaemyh sistem [Perturbation methods in improvement and optimization problems for control systems]. Ulan-Ude, Buryat State Univ. Publ., 2008. 256 p. (In Russian).

6. Buldaev A.S. A boundary improvement problem for linearly controlled processes. Autom. Remote Control, 2011, vol. 72, issue 6, pp. 1221-1228. https://doi.org/10.1134/S0005117911060087

7. Buldaev A.S., Morzhin O.V. Modifikaciya metoda proekcij dlya uluchsheniya nelinejnyh upravlenij [Modification of the projecting method for nonlinear controls improvement]. Vestnik Buryatskogo gosudarstvennogo universiteta. Matematika i informatika, 2010, pp. 10-17. (In Russian).

8. Buldaev A.S., Morzhin O.V. Improvement of controls in nonlinear systems based on boundary value problems. Izvestiya Irk. Gos. Univ., Ser. Matematika, 2009, vol. 2, no. 1, pp. 94-106. (In Russian).

9. Buldaev A.S., Khishektueva I.-Kh.D. The fixed point method in parametric optimization problems for systems. Autom. Remote Control, 2013, vol. 74, issue 12, pp. 1927-1934. https://doi.org/10.1134/S0005117913120011

10. Butkovsky A.G. Teoriya optimal'nogo upravleniya sistemami s raspredelennymi parametrami [The theory of optimal control for systems with distributed parameters]. Moscow, Nauka, 1965. 476 p. (In Russian).

11. Gabasov R., Kirillova F.M. Kachestvennaya teoriya optimal'nyh processov [Qualitative Theory of Optimal Processes]. Moscow, Nauka, 1971. 508 p. (In Russian).

12. Gurman Vladimir Iosifovich. Wikipedia. URL: https://ru.wikipedia.org/wiki/ Гурман,_Владимир_Иосифович (in Russian).

13. Gurman V.I. Princip rasshireniya v zadachah upravleniya [The Extension Principle in Control Problems]. 2nd ed. Moscow, Fizmatlit, 1997. 288 p. (In Russian).

14. Gurman V.I., Baturin V.A., Danilina E.V., et al. Novye metody uluchsheniya upravlyaemyh processov [New methods for improvement of control processes]. Novosibirsk, Nauka, 1987. 184 p. (In Russian).

15. Gurman V.I., Baturin V.A., Moskalenko A.I., et al. Metody uluchsheniya v vychislitel'norri ehksperimente [Methods for improvement in computational experiments]. Novosibirsk, Nauka, 1988. 184 p. (In Russian).

16. Gurman V.I., Baturin V.A., Rasina I.V., et al. Priblizhennye metody optimal'nogo upravleniya [Approximate methods of optimal control]. Irkutsk, Irkutsk Univ. Publ., 1983. 180 p. (In Russian).

17. Dykhta V.A. Positional strengthenings of a maximum principle and sufficient conditions for optimality. Proc. Steklov Inst. Math., 2016, vol. 293, suppl. 1, pp. S43-S57. https://doi.org/10.1134/S0081543816050059

18. Krotov Vadim Fedorovich. Wikipedia. URL: https://ru.wikipedia.org/wiki/ Кротов,_Вадим_Фёдорович (in Russian).

19. Krotov V.F., Bukreev V.Z., Gurman V.I. Novye metody variacionnogo ischisleniya v dinamike poleta [New Variational Methods in Flight Dynamics]. Moscow, Mashinostroenie, 1969. 288 p. (In Russian).

20. Krotov V.F., Gurman V.I. Metody i zadachi optimal'nogo upravleniya [Optimal Control: Methods and Problems]. Moscow, Nauka, 1973. 448 p. (In Russian).

21. Morzhin O.V. Nonlocal improvement of nonlinear controlled processes on the basis of sufficient optimality conditions. Autom. Remote Control, 2010, vol. 71, no 8, pp. 1526-1539. https://doi.org/10.1134/S0005117910080035

22. Morzhin O.V. Nonlocal improvement of controlling functions and parameters in nonlinear dynamical systems. Autom. Remote Control, 2012, vol. 73, issue 11, pp. 1822-1837. https://doi.org/10.1134/S0005117912110057

23. Morzhin O.V. Nelokal'nye uluchsheniya upravlenij v nelinejnyh diskretnyh zadachah optimal'nogo upravleniya [Nonlocal improvements of controls in nonlinear discrete optimal control problems]. 12th All-Russian Meeting on Control Problems. Moscow, ICS RAS, 2014. Pp. 650-658. URL: http://vspu2014.ipu.ru/prcdngs. (In Russian).

24. Panteleev A.V., Bortakovsky A.S. Teoriya upravleniya v primerah i zadachah [Control theory in examples and tasks]. Moscow, Vyshaya shkola, 2003. 583 p. (In Russian).

25. Pontryagin L.S., Boltyanskii V.G., Gamkrelidze R.V., Mishchenko E.F. The Mathematical Theory of Optimal Processes. Oxford, Pergamon Press, 1964.

26. Propoi A.I. Elementy teorii optimal'nyh diskretnyh processov [Elements of the theory of optimal discrete processes]. Moscow, Nauka, 1973. 256 p. (In Russian).

27. Rozonoer L.I. L.S. Pontryagin maximum principle in the theory of optimum systems. I, II, III. Autom. Remote Control, 1959, vol. 20, pp. 1288-1302, 1405-1421, 1517-1532.

28. Srochko V.A. Iteracionnye metody resheniya zadach optimal'nogo upravleniya [Iterative methods for solving optimal control problems]. Moscow, Fizmatlit, 2000. 160 p. (In Russian).

29. Srochko V.A., Antonik V.G. Optimality conditions for extremal controls in bilinear and quadratic problems. Russ. Math., 2016, vol. 60, issue 5, pp. 75-80. https://doi.org/10.3103/S1066369X1605008X

30. Krotov V.F. Global methods in optimal control theory. New York, Marcel Dekker, 1996. 408 p.

Morzhin Oleg Vasilievich, Candidate of Sciences (Physics and Mathematics), Senior Research Scientist, V. A. Trapeznikov Institute of Control Sciences RAS, 65, Profsoyuznaya st., Moscow, 117997, www.ipu.ru/staff/oleg_morzhin (e-mail: [email protected])

Нелокальное улучшение управлений в нелинейных дискретных системах Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Моржин Олег Васильевич

Похожие темы научных работ по математике , автор научной работы — Моржин Олег Васильевич

Nonlocal Improvement of Controls in Nonlinear Discrete Systems

Текст научной работы на тему «Нелокальное улучшение управлений в нелинейных дискретных системах»