Научная статья на тему 'АНАЛОГ ЛИНЕАРИЗОВАННОГО ПРИНЦИПА МАКСИМУМА ДЛЯ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ НЕЛИНЕЙНЫМИ РАЗНОСТНЫМИ УРАВНЕНИЯМИ ДРОБНОГО ПОРЯДКА'

АНАЛОГ ЛИНЕАРИЗОВАННОГО ПРИНЦИПА МАКСИМУМА ДЛЯ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ НЕЛИНЕЙНЫМИ РАЗНОСТНЫМИ УРАВНЕНИЯМИ ДРОБНОГО ПОРЯДКА Текст научной статьи по специальности «Математика»

CC BY
57
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДОПУСТИМОЕ УПРАВЛЕНИЯ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЯ / РАЗНОСТНОЕ УРАВНЕНИЕ ДРОБНОГО ПОРЯДКА / ДРОБНЫЙ ОПЕРАТОР / ЛИНЕАРИЗОВАННЫЙ ПРИНЦИП МАКСИМУМА / ДРОБНАЯ СУММА / МЕТОД ПРИРАЩЕНИЙ ФУНКЦИОНАЛА / ВЫПУКЛОЕ МНОЖЕСТВО

Аннотация научной статьи по математике, автор научной работы — Алиева С.Т., Мансимов К.Б.

Рассматривается задача оптимального управления объектом, описываемая системой нелинейных разностных уравнений дробного порядка. Применяя один вариант метода приращений установлен дискретный аналог линеаризованного принципа максимума.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Алиева С.Т., Мансимов К.Б.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AN ANALOGUE OF THE LINEARIZED MAXIMUM PRINCIPLE FOR THE OPTIMAL CONTROL PROBLEM FOR NONLINEAR DIFFERENCE EQUATIONS OF FRACTIONAL ORDER

Problem of optimal control of an object, described by a system of nonlinear difference equations of fractional order, is considered. Applying one version of the method of increments, a discrete an-alogue of the linearized maximum principle is established.

Текст научной работы на тему «АНАЛОГ ЛИНЕАРИЗОВАННОГО ПРИНЦИПА МАКСИМУМА ДЛЯ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ НЕЛИНЕЙНЫМИ РАЗНОСТНЫМИ УРАВНЕНИЯМИ ДРОБНОГО ПОРЯДКА»

2021

ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА

Математика. Механика. Информатика

Вып. 1(52)

УДК 517.977.56

Аналог линеаризованного принципа максимума для задачи оптимального управления нелинейными разностными уравнениями дробного порядка

С. Т. Алиева1, 2, К. Б. Мансимов1, 2

1Бакинский Государственный Университет

Az, 1148, Азербайджан, г. Баку, ул. З. Халилова, 23

2Институт систем управления НАН Азербайджана

Az, 1141, Азербайджан, г. Баку, ул. Бахтияра Вагабзаде, 68

saadata@mail.ru

kamilbmansimov@gmail.com

Рассматривается задача оптимального управления объектом, описываемая системой нелинейных разностных уравнений дробного порядка. Применяя один вариант метода приращений установлен дискретный аналог линеаризованного принципа максимума.

Ключевые слова: допустимое управления; оптимальное управления; разностное уравнение дробного порядка; дробный оператор, линеаризованный принцип максимума, дробная сумма, метод приращений функционала, выпуклое множество.

DOI: 10.17072/1993-0550-2021-1-9-15

Введение

Производные нецелого порядка, а также дробные дифференциальные и разностные уравнения различного типа находят широкое применение в современных исследованиях в теоретической физике, механике и технике [1-5]. Наличие в уравнениях дробной конечной разности интерпретируется как отражение свойства памяти процесса. В настоящее время разработке качественной теория дифференциальных уравнений дробного порядка и соответствующих им разностных уравнений дробного порядка уделяется большое внимание. Исходя из теоретических и практических приложений, разработка качественной теории оптимального управления системами, описываемыми различными разностными уравнениями дробного порядка, также является актуальной. Теория необходимых условий оптимальности в задачах оптимального управле-

© Алиева С. Т., Мансимов К. Б., 2021

ния описываемых разностными уравнениями дробного порядка очень мало изучена. Исходя из вышеизложенного предлагаемая работа посвящена постановке и исследованию одной терминальной задачи оптимального управления, описываемого системой обыкновенных разностных уравнений дробного порядка.

В настоящей статье формулируется и доказывается линеаризованный принцип максимума для случая, когда динамика системы задана разностными уравнениями дробного порядка. Сформулирован и доказан дискретный аналог линеаризованного принципа максимума.

1. Основные понятия и постановка задачи

Сначала, следуя [6], приведем некоторые понятия и определения, которые в даль-ней-шем будут существенно использованы.

Пусть N - множество натуральных чисел вместе с нулем.

Для а Е Z введем следующие обозначения: N+={a, а + 1,а + 2,...,}, a(t) = t + 1, p(t) = t-1.

Определение 1. Выражение

п-1

А-аи

(п) = Х

j=0

j + а — 1

IL

= I

j=0

п — j + a — 1 n— j

u(n — j) —

u(j).

называется дробной суммой порядка а.

Определение 4. Выражение, определяемое формулой

п-1

Ааи(п) — I

а

Аи(п — j) —

]=0

(п — а — 1\

называется дробным оператором порядка а.

Здесь является биномиальным

коэффициентом определяемая следующим образом:

Г(а + 1)

-,п>0,

о-п

Г(а — п + 1)Г(п + 1) '

0,

п — 0 п < 0.

Пусть Г(х) — гамма-функция, для которой всегда выполняется условие Г(х + 1) = хГ(х).

Для любого х,у е Я, , х(у) = г^х+11 .

^ " Г(х+1-у)

Заметим, что дробную сумму и дробный оператор порядка а можно определить еще и следующим образом:

Пусть а - произвольное действительное число, а Ь = к + а, здесь к е N,к >2.

Пусть по определению Т = {а,а + 1, ...,Ь} , Тк = {а,а + 1, ...,Ъ — 1}.

Через Т обозначим множество функций определенных на Т.

Определение 3. Пусть / еТ, заданная функция. Выражения, определяемые формулами порядка

| ,-а

гН;

А -V (t ) = ^ -а(, )ГУ (, ),

,АГ/(, )=^ £ (^))(а-1/ (^ )• 1 (а) а

называются соответственно левой и правой дробными суммами порядка а > 0.

Определение 4. Пусть 0 < а < 1 и ^ = 1 — а, / еТ заданная функция. Выражения, определяемые следующим образом, называются соответственно:

а А,а/( X ) = Д( а А,( X )) ,

( Д;а/(X ) = -Д( , А;'"/(X ))•

левым и правым дробными операторами порядка а функции [ е Т.

Опишем некоторые свойства дробной суммы и дробной разности (оператора):

1. АаА?№) = Аа+^1(1);

2. А-аАа№ = № — Д0);

3. АаА-а/&)

4. Аа/(0) = 0 и АаЦ1) = ¡(1) — ¡(0) = АГ(1).

Теорема 1 [7] (О дробном суммировании по частям). Пусть / и д - заданные неотрицательные действительные функции, определенные на Тк и Т. Если 0 < а < 1 и ^ = 1 — а, тогда

Ь-1

^№аА?д(Ь)=Г(Ь — 1)д(Ь) —

Ь-2

—Г(а)д(а) + ^ гА%Г(1)д°(1) =

^Ъ-2

+

, t=a

Ь-1

- ^ (t + ^-a(a))(ß-1)f(t).

t=a(a)

Перейдем к постановке задачи оптимального управления.

Пусть требуется найти минимальное значение терминального функционала

S(u) = <p(x(ti)) (1)

при следующих ограничениях:

u(t) EU ERr, (2)

Aax(t + 1) = f(t,x(t),u(t)),t ET, (3)

x(to) = xo. (4)

Здесь х(0 - «-мерный вектор фазовых переменных; н(0 - г-мерный дискретный вектор управляющих воздействий; и - заданное непустое ограниченное и выпуклое множество; числа и х0 - постоянный вектор заданы; /(Ь, х, и) — заданная «-мерная вектор-функция, непрерывная по совокупности переменных вместе с частными производными по х и и; <р(х) - заданная непрерывно дифференцируемая скалярная функция, а Аах(Ь), 0 < а < 1- - дробный оператор порядка а.

Управляющую функцию назовем допустимым управлением, если оно удовлетворяет вышеприведенным ограничениям. Предполагается, что при каждом заданном допустимом управлении дискретный аналог задачи Коши (1)-(2) имеет единственное дискретное решение.

Допустимое управление и(Ь), доставляющее минимум функционалу (1) при ограничениях (2)-(4), назовем оптимальным управлением, а при этом пару (и(Ь),х(Ь)^ -оптимальным процессом.

В дальнейшем задачу о минимуме функционала (1) при ограничениях (2)-(4) для краткости будем называть задачей (1)-(4).

Целью работы является вывод необходимого условия оптимальности в рассматриваемой задаче, с помощью одного варианта метода приращений предложенный в [8] и развитий в работах в [9] и др.

Перейдем к выводу необходимости условия оптимальности.

2. Формула приращения критерия качества и необходимое условие оптимальности

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть (и(Ь),х(Ь)^ - фиксированный допустимый процесс, а (й(Ь) = и(Ь) + +Аи(Ь),х(1) = х(Ь) + Ах(Ь)^) - произвольный допустимый процесс.

Учитывая введенные обозначения, получаем, что Ах(Ь) (приращение траектории), соответствующее Аи(Ь) (приращению управления), удовлетворяет системе

Аа(Ах(Ь + 1)) = /(Ьх(0,и(0) —

—Г(1,х(0,и(0), (5)

Ах(г0) = 0.

С другой стороны, приращение функционала 5 (и), отвечающее приращению Аи(Ь) управления, имеет следующий вид:

АБ(и) = Б (и) — Б (и) = Б(и + Аи) — Б (и) = = ^(х(1г) + Ах(Ь1)) — ^(х^)). (6)

Через ^(Ь) обозначим пока неизвестный п -мерный вектор-столбец и положим

Н(Ь, х, и, тр) = х, и).

Здесь штрих для векторов означает операцию скалярного произведения. Функцию х, и, ~ф) назовем функцией Гамильтона— Понтрягина для рассматриваемой задачи.

Умножая обе части соотношения (5) слева скалярно на ^(0, а затем, суммируя обе части полученного тождества по £ от до ^ — 1, и принимая во внимание выражение функции Гамильтона-Понтрягина, получаем, что

^ Ц)'(Ь)Аа(Ах(1 + 1)) = г=1о

4-1

= ^ ^'(ф(1,тмо)—г(1,Х(о,и(о)1

С учетом этого тождества приращение (6) функционала (1) может быть записать следующим образом:

АБ(и) = ^(х(Ь1) + Ах(^)) — ^(х(Ь1)) + 4-1

+ ^ ^'(0Аа(Ах(1 + 1)) — 4-1

— ^ [Н(1,х(1),й(1),-ф(1)) —

о

—Н(ь, х(Ь), и(Ь), ^(Ь))].

Теперь займемся преобразованием одного из слагаемых этой формулы.

С этой целью рассмотрим выражение

?=1ф'(1)Аа(Ах(1 + 1)). (7)

Сде лав в не м заме ну переменных ¿ + 1 = 5 , получим

и-1

и-2

+ ^^'(1)Аа(Ах(1)). (8)

=

Далее с учетом теоремы о дробном суммировании по частям приведенной выше, имеем

-1

1)Аа(Ах(1)) =

=

= — 1)Аа(Ах(^)) — —ф'(Ь0 — 1)Аа(Ах(10)) +

4-2

+ ^ Ар(и)^'^ — 1)Ах(1) —

= 0

И

■Ах(Ьо)

-1

£( 1 + и — ш —

=

Г(И)

— 1 + И — О(1о))(1*-1)АХ(0

-1

= 0

= — 1)Аа(Ах(^)) +

1-2

= 0

(9)

С учетом тождества (9) из (7) получим АБ(и) = р(х(^) + Ах(^)) — ^(х(Ь1)) +

+хр'(Ь — 1)Аа(Ах(^)) + ¿=-2 {А %^)Ц>'(1 — 1)Ах(1) —

1-1

— ^ [Н(ЬхЮ.йЦХфЮ) —

=

1 - 1

+ ^ {А аК{1)ф«-»Ах(Ь) —

= 0

1 и-1

^ н'х №х(ь) — ^ н'и №и(ь) —

= 0 = 0 и-1

^ О1(УАх(0У) + О2(УАха1)У). (11)

Здесь величины 0^(.),1 = 1,2, определяются соответственно из разложения

Н(ь,х(ь),и(ь),$(ь)) — Н(ь,х(ь),и(ь),-ф(ь)) =

= Нх(ь,х(Ь),и(Ь),-ф(Ь))Ах(Ь) + +Ни( Ь,х(0,и(0,ф(Ь))Аи(Ь) + 01(||Ах(0||),

<р + Ах(^))) — <р(х(Ь)) = = р'х(х)Ах(^) + 02(ЦАх(^)Ц).

Теперь предположим, что ^(Ь) является решением следующей системы линейных однородных дробного порядка разностных уравнений:

Ар( Ч)гр(1 — 1) = Нх№, 1 = 11 — 1.....10,

гР(11 — 1) = —срх(х(11)). (12)

Систему (12) назовем сопряженной системой в рассматриваемой задаче (1)-(4).

При выполнении соотношений (12) формула приращения (11) примет следующий вид:

-1

Б(и) = — ^Н'и [Ь]Аи + ^(и; Аи), (13)

=

где по определению

и-1

—Н(1,х(1),и(1),^(1))]. (10) ч(и.Аи) = 02(ЦАх(1!)11) 01 (||Ах(0||) ростоты дальнейшего изложения = 0

Для простоты дальнейшего изложения введем следующие обозначения:

Ш = Гх(1,х(0,и(0), Нх№ = Нх(ьх(0,и(0,ф(0),

Ни№ = Ни(ь,х(ь),и(ь),ф(ь)),

Из (10) используя формулу Тейлора, получим, что

АБ(и) = <р'х(х)Ах(Ь1) + — 1)Ах(^) +

Здесь норма||а|| есть норма вектора, а определяемая следующим образом

п

=1

В дальнейшем нам понадобится оценка для ||Ах( £)||. С этой целью, применяя к обеим сторонам уравнения (3) дробную сумму Л~а, имеем

0

А-аАах(Ь + 1) = А-а/(г, х(Ь), и(Ь)). (14)

Теперь рассмотрим выражение

А-аАах(Ь + 1).

Учитывая вышеприведенные свойства операторов дробной суммы и дробной разности, проведем следующие преобразования:

А-аАах(Ь + 1) = А-а(А1-^х(Ь + 1)) =

= А-аА-^(Ах(Ь + 1)) = А-1(Ах(Ь + 1)) = г

^ (х(г + 1) — х(Ь)) = х(Ь + 1) — х(Ь0).

Правая сторона соотношения (14) будет иметь вид:

А-а!(1,х(1),и(1)) =

= 11^Аа(1,])(\\АхШ + \\Аит)

]={о

Применяя к последнему неравенству дискретный аналог леммы Гронуолла-Беллмана дробного порядка, (см. напр., [6]) получим справедливость оценки г-1

\\х(1 + 1)\\ < 12 П(1 + Ла(1,])\\Аиф\\),

]=to

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

t = tQ, tQ + 1, ..., 11.

(15)

1 v ^--n здесь *

^ ^{t + pW - ) f(j, X(j), u(J)) = v(t)EU,tET

Теперь, считая и(Ь),х(1) оптимальным процессом, специальное приращение оптимального управления и(Ь) определим следующим образом:

Аи(Ь; £) = £[у(0 — и(0]. (16) Здесь £ е [0,1] —произвольное число, а

Г(а) 4

J=to

j = to

t — j + a — 1 t-i

f{j,x(j),u(j)) =

= УAa(t,j)f{j,x(j),u(j)).

Здесь

] = to

Aa(t,j) =

t — j + a — 1

t—j

Таким образом, доказали, что t

X(t+1) =X(tn)+ У Aa(t,l)T(l,X(l),U(

j=to

c(t + 1) = x(to) + У Aa(t,j)f{j,x(J),u(J)).

Отсюда, переходя к норме и используя условия Липшица, получаем, что

г

\\Аха + 1)\\ = ^Аа(1 — 1,])

х

]=to

х \\f{j,m.m)—f{j,x(j).u(j))\\ < <L1lyjAa(t,j)\\x(j) — x(j)W +

\J = to

В силу выпуклости множества U специальное приращение оптимального управления u(t ), определяемое формулой (15), будет допустимым.

На самом деле:

us(t) = u(t) + Au(t; £) =

= U(t) + £[v(t) — U(t)] = £v(t) + (1— £), u(t) E U.

Через Ax(t; £) обозначим специальное приращение оптимальной траектории x(t), отвечающее специальному приращению управления u(t), определяемое формулой (16).

С учетом оценки (15) получаем, что

\\Ax(t;£)\\<L3£, tETUtlt (17)

L3 = const > 0, некоторое постоянная.

Учитывая оценки (15) и (17) из формулы приращения (13) получим справедливость следующего неравенства:

ASs(u) = S{u(t) + Au(t; е)) — S{u(t)) =

ti-i

= — У H'u [t]Au(t; £) + ^{u; Au(t; £)) =

L

+ УАа(Ш\й(]) — и(])\\) =

t=tn

ti-i

] = to

= —£ун'и [t]{v(t) — u(t)) +

t = to

t

+о( ¿) > 0.

(18)

Из неравенства (18) в силу достаточной малости и произвольности е получаем что,

tt1=-lH'u M(v(t)-u(t)}<0.

(19)

Таким образом, доказано следующее утверждение.

Теорема 2. (Аналог линеаризованного принципа максимума). Если в задаче (1)-(4) множество и выпукло, а /(Ь, х, и) непрерывно дифференцируема по х и и, то для оптимальности допустимого управления и(Ь) необходимо, чтобы неравенство (19) выполнялось для всех р(ь) е иет,.

Соотношение (1 9) является аналогом линеаризованного (дифференциального) принципа максимума.

Непосредственным следствием этой теоремы является следующее.

Следствие. (Поточечный линеаризованный принцип максимума). Если множество и выпукло, а вектор функция /(Ь, х. и) непрерывна по совокупности переменных вместе с частными производными по х,и, то для оптимальности допустимого управления и(Ь) в рассматриваемой задаче необходимо, чтобы неравенство

Н'и[9](у — и(в))<0 выполнялось для всех V е и, и в е Т.

Для доказательства этого неравенства достаточно в неравенстве (19) v(t) определить следующим образом:

Ь = в,веТ

'(t) = {Vu(o,

t Ф в,

где в Е Т - произвольная точка, а V Е U - произвольный вектор.

Список литературы

1. Miller K., Ross B. An introduction to the frac-

tional calculus and fractional differential equations. New York: Wiley, 1993. 366 p.

2.M.Feckan,J.Wang,M.Pospisil. Fractional-order equations and inclusions. Vol. 3. 2010. 384 p.

3. Podlubny I. Fractional differential equations. San Diego: Acad. Press, 1999. 340 p.

3. Нахушев A.M. О непрерывных диффе-

ренциальных уравнениях и их разностных аналогах // ДАН СССР. 1988. Т. 300, № 4. С.729-732.

4. Нахушев A.M. Дробное исчисление и его

примене ние. М . : Ф изматлит, 2003 . 272 с .

5. Kilbas A.A., Srivastava H.M., Trujillo J.J.

Theory and Applications of Fractional Differential Equations, Elsevier, Amsterdam, вектор функциThe Netherlands, 2006.

6. J.Jagan Mohan, G.V.Deekshitulu. Fractional order difference equations. International journal of differential equations. Vol. 2012. Article ID 780619. P. 1-11.

7. Nuno R.O. Bastos, Rui A.C. Ferreria, Delfm F.M. Torres. Necessary optimality conditions for fractional difference problems of the calculus of variations. Discrete and Continuous Dynamical Systems-Series B (DCDS-B). 2010. P. 21.

8. Розоноэр Л.И. Принцип максимума Л.С.

Понтрягина в теории оптимальных систем. I, Автоматика и телемеханика. 1959. Т. 20, вып. 10. C. 1320-1334.

9. Габасов Р., Кириллова Ф.М. Оптимизация

линейных систем. Минск: Изд-во БГУ, 1973.256 с.

10. Samko S.G., Kilbas A.A., Marichev O.I. Integrals and Derivatives of Fractional Order and Some of their Applications, Nauka I Tekhni-ka, Minsk, Belarus, 1987.

11. Christopher Goodric, Allan C.Piterson. Discrete fractional calculus.Department of Math-ematic University of Nebraska-Lincoln Lincoln, NE, USA. 2015.

12. Габасов Р., Кириллова Ф.М, Альсевич В.В. Методы оптимизации. Минск: Изд-во "Четыре четверти", 2011. 472 с

13. Мансимов К.Б. Дискретные системы. Баку: Изд-во Бакинского гос. ун-та, 2002. 114 с.

14.Учайкин В.В. Методы дробных производных // Известия вузов. ПНД. 2019. Т. 27, вып. 1. С. 5-40.

15. Самко С.Г., Килбас А.А., Маричев О.И. Интегралы и производные дробного порядка и некоторые их приложения. Минск: Наука и техника, 1987.

16. T. Kaczorek. Reachability of positive 2D fractional linear systems. Physica Scripta, 2009.

17. Sajewski L. Positive realization of SISO 2D different orders fractional discrete-time linear systems. Acta Mechanica et Automatica 5(2). 122-127 (2011).

An analogue of the linearized maximum principle for the optimal control problem for nonlinear difference equations of fractional order

S. T. Alieva12, K. B. Mansimov12

Baku State University; 23, Z. Khalilov st., Baku, Az, 1148, Azerbaijan saadata@mail.ru

Institute of control system of the National academy of sciences of Azerbaijan 68, Bakhtiyar Vagabzade st., Baku, Az, 1141, Azerbaijan kamilbmansimov@gmail.com

Problem of optimal control of an object, described by a system of nonlinear difference equations of fractional order, is considered. Applying one version of the method of increments, a discrete analogue of the linearized maximum principle is established.

Keywords: admissible control; optimal control; fractional difference equation; fractional operator; linearized maximum principle; fractional sum; method of functional increments.

i Надоели баннеры? Вы всегда можете отключить рекламу.