Научная статья на тему 'ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА ДЛЯ НЕЛИНЕЙНЫХ РАЗНОСТНЫХ УРАВНЕНИЙ ДРОБНОГО ПОРЯДКА'

ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА ДЛЯ НЕЛИНЕЙНЫХ РАЗНОСТНЫХ УРАВНЕНИЙ ДРОБНОГО ПОРЯДКА Текст научной статьи по специальности «Математика»

CC BY
114
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДОПУСТИМОЕ УПРАВЛЕНИЕ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / РАЗНОСТНЫЕ УРАВНЕНИЯ ДРОБНОГО ПОРЯДКА / ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА

Аннотация научной статьи по математике, автор научной работы — Алиева Саадат Тофик Кызы

Рассматривается задача оптимального управления объектом, описываемым системой нелинейных разностных уравнений дробного порядка. Установлен дискретный аналог принципа максимума Понтрягина.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Алиева Саадат Тофик Кызы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE PONTRYAGIN MAXIMUM PRINCIPLE FOR NONLINEAR FRACTIONAL ORDER DIFFERENCE EQUATIONS

The problem of optimal control of an object described by a system of nonlinear difference equations of fractional order is considered. A discrete analogue of the Pontryagin maximum principle is established.

Текст научной работы на тему «ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА ДЛЯ НЕЛИНЕЙНЫХ РАЗНОСТНЫХ УРАВНЕНИЙ ДРОБНОГО ПОРЯДКА»

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

2021 Управление, вычислительная техника и информатика № 54

УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ

УДК 517.977

БО!: 10.17223/19988605/54/1

С.Т. Алиева

ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА ДЛЯ НЕЛИНЕЙНЫХ РАЗНОСТНЫХ УРАВНЕНИЙ ДРОБНОГО ПОРЯДКА

Рассматривается задача оптимального управления объектом, описываемым системой нелинейных разностных уравнений дробного порядка. Установлен дискретный аналог принципа максимума Понтрягина. Ключевые слова: допустимое управление; оптимальное управление; разностные уравнения дробного порядка; принцип максимума Понтрягина.

Известно, что принцип максимума Понтрягина является необходимым условием локального минимума. Это условие дает возможность среди всех возможных допустимых управлений выделить те, которые могут претендовать на роль оптимальных.

Производные нецелого порядка, дробные дифференциальные и разностные уравнения находят применение в современных исследованиях в теоретической физике, механике и технике. Наличие в уравнениях дробной конечной разности интерпретируется как отражение свойства памяти процесса. Вопросы развития теории и практики применения дифференциальных уравнений дробного порядка и, соответственно, их дискретных аналогов - разностных уравнений дробного порядка - рассмотрены в работах [1-7].

Дискретному принципу максимума для задач оптимального управления посвящено большое количество работ, среди них можно выделить работы [8-10]. В настоящей статье формулируется и доказывается принцип максимума Понтрягина для случая, когда динамика системы задана разностными уравнениями дробного порядка.

Сначала приведем некоторые понятия и определения, необходимые в дальнейшем [1]. Пусть N -множество натуральных чисел вместе с нулем. Для а е 2 введем следующие обозначения:

1. Основные понятия и постановка задачи

Ыа+ ={а,а+ 1,а + 2,...,}, ст(г) = г +1, р(г) = г -1.

Определение 1. Расширенный биномиальный коэффициент

определяется следующим об-

разом:

Г( а +1)

, п > 0,

1,

0,

п = 0, п < 0.

(у) Г(х +1)

Пусть для любого х, у е Я, х( ) = —--- , где Г - гамма-функция, для которой выполняется

Г(х +1 - у)

Г( х +1 )= хГ( х).

Определение 2. Дробная сумма порядка а определяется следующим образом:

-1 (] + а-1^ , . (п-] + а- 1Л

А-аи(п) = £I 7 +а-1 и(п-7) = Е| п-7 +а-1 и(7)

1=о V 7

а дробный оператор порядка а определяется как

М Vп - 7

/ч (7 - аЛ , ч ^ (п - ] - а-1 (п - а-1 Л /ч

Ааи(п) = ЕК. Аи(п-7) = Х[п-7 |(7)- п а и(0).

/

V п -1

г-а

А, - Г (г ) = »-«(^ Г" Г (^),

г А,-а/ (г ) = т^ £ (*-°(г ))(а-)/ (*).

7=о V 7

Одновременно дробную сумму и дробный оператор порядка а можно определить еще и следующим образом.

Пусть а - произвольное действительное и Ь = к + а, здесь к е Ы, к > 2; Т = {а, а +1,...,Ь}, Тк ={а, а +1,..., Ь -1}. Через Т обозначим множество функций определенных на Т.

Определение 3. Пусть / е Т, левые и правые дробные суммы порядка а > 0. Они соответственно определяются следующим образом:

1 ^ -Г ^(а-0

Г(а)% ' ' "

\(а-1)

У IV — ГТ I / I

Г(а) $=г+а

Определение 4. Пусть 0< а < 1 и ц = 1 - а тогда / еТ, левые и правые дробные суммы порядка а определяются следующим образом:

а А,*/(г) = а( а А,"V(г)) ,

г v/(г ) = -а( г аь-»/ (г)).

Опишем некоторые свойства дробной суммы и дробной разности:

1. АаАр/ (г ) = Аа+р/ (г);

2. А-аАа/ (г ) = /(г)-/(0);

3. АаА-а/(г ) = / (г);

4. да/(0) = 0 и Аа/(1) = / (1)-/(0) = А/ (1).

Теорема (дробное суммирование по частям). Пусть / и g - неотрицательные функции с действительными значениями, определенными на Тк и Тсоответственно. Если 0<а< 1 и ц = 1 -а, тогда

11/ (г )а Ааг£ (г ) = / (Ь-1) я (6)-/(а) Я (а ) + Ьг Аа, / (г) е ° (г) +

г=а г-а

(ъ-\ Ь-1 Л

Е(а) 2^+ ^а/-V(г)- % (г + 1—(а)Г/(г) .

I (Ц +1) ^г=а г=а(а) ^

Рассмотрим систему нелинейных разностных уравнений дробного порядка а

Аах (г +1)=/(г, х (г ),и (г)) г е Т = {г0, г0 +1,..., ^ -1}, (1)

с начальными условиями

х(,0 ) = х0. (2)

Здесь х(У) - «-мерный вектор фазовых переменных, и(1) - г-мерный вектор управляющих воздействий, значения ¿о, ¿1, хо заданы, х, и) - заданная «-мерная вектор-функция, компоненты которой

У (г = 1,п) непрерывны по совокупности переменных вместе с частными производными по фазовым переменным -] 1, г,у = 1,п .

[а*,. ]

Управление и (г ) = {и (г0 ), и (г0 +1) ,...,и (г1 -1)} называется допустимым управлением, если оно удовлетворяет ограничению

и(г)е и с Яг, г е Т. (3)

Здесь и - заданное непустое ограниченное множество.

На решениях х(г) = {*(г0),х(г0 +1),...,х(г1)} системы (1)-(2), порожденных всевозможными допустимыми управлениями, определим функционал

5 (и ) = ф( х (г)), (4)

где ф( х) - заданная скалярная функция, непрерывная вместе с фх (х) .

Допустимое управление и (г), доставляющее минимум функционалу (4) при ограничениях (1)-(3), называется оптимальным управлением, при этом пара (и (г), х (г)) называется оптимальным процессом.

В дальнейшем задачу о минимуме функционала (4) при ограничениях (1)-(3) будем называть задачей (1)-(4).

Нашей целью является вывод необходимых условий оптимальности в рассматриваемой задаче. С этой целью будем использовать один вариант метода приращений.

2. Формула приращения критерия качества и необходимое условие оптимальности

Пусть и (г) - фиксированное, а и (г) = и (г) + Ди (г) - произвольное допустимые управления. Через х(г) и х (г) = х(г) + Дх(г) обозначим соответствующие им решения системы (1)-(2).

Отсюда получим, что Дх (г) - приращение траектории, соответствующее Ди (г) - приращению управления, будет удовлетворять системе

[да (Дх (г +1)) = у (г, х (г), и (г))-у(г, х (г), и (г)), [дх (г0 ) = 0 .

С другой стороны, приращение функционала 5 (и), отвечающее приращению Ди (г) управления, имеет следующий вид:

Д5 (и ) = 5 (и)- 5 (и ) = 5 (и + Ди)- 5 (и ) = = ф( х (гг) + Дх ))-ф( х )).

Через у(г) обозначим пока неизвестный «-мерный вектор-столбец и положим

Н (г, х,и, у) = у У (г, х,и) .

Функция Н (г, х, и, у) называется функцией Гамильтона-Понтрягина для рассматриваемой задачи (1)-(4).

Умножая обе части соотношения (5) скалярно на у (г) , а затем суммируя обе части полученного тождества по ^ от ¿о до ¿1 - 1 и принимая во внимание выражение функции Гамильтона-Понтрягина, получим

г -1 г -1

£ у'(г )Да(Дх (г +1)) = £ у'(г)[ у (г, х (г), и (г))-у (г, х (г), и (г ))] =

г = го г = го

г1 -1

= £[Н(г, х (г),и(г), у(г))-Н(г,х(г),и (г),у(г))].

г=10

С учетом этого тождества приращение (6) функционала можно записать следующим образом:

4-1

Д5 (и) = ф( х (г) + Дх (г)) - ф( х (^)) + £у'(г) Да (Дх (г +1)) -

г=0

4-1

-£[[ (г,х (г), и (г), у(г))-Н (г, х (г), и (г), у(г))]. (7)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

г=0

Займемся преобразованием этой формулы. С этой целью рассмотрим выражение

г1 -1

£ у'( г )Да (Дх (г +1)).

г=г0

Сделав в нем замену переменных г +1 = ^ , получим

£у'(г)Да(Дх(г +1))= £ у'(г- 1)Да(Дх(г)) =

г=4 г=4 +1

= у'(А - 1)Да(Дх (гх ))-у'(га - 1)Да(Дх (га )) + £у'(г - 1)Да(Дх (г ))= (8)

г =0

г-1

= у'( г, -1) Да (Дх (гх)) + £ у'(г -1) Да (Дх (г)) .

г =0

Далее, с учетом теорем, приведенных выше, имеем

г.-1

£у'( г - 1)Да(Дх (г )) = у'( г - 1)Дх (г )-у'(г0 - 1)Дх (г0) +

г=г0

^ - 2 [ I, -1 (М)

+ V л Л I ^

£ г Др(г )ау'( г - 1)Дх (г)^^ртДх (г0) £(г + ц- г0) у(г)- (9)

г=го V/ г=го

к -1 (м)

-£ (г + ц-а(г0)) Дх (г)

г=г„

к - 2

= у'(г -1) Дх ^) + £ г Др(, )ау'(г -1) Дх (г).

С учетом тождества (9) из (7) получим

Д5 (и ) = ф( х (г1) +Дх (г1 ))-ф( х (гг )) + У(гх - 1)Дх (г1) +

+£ г Др(г )ау'(г - 1)Дх (г)-£ [н (г, х (г), и (г), у(г))-Н (г, х (г), и (г), у(г))] . (10)

г=г0 г=г0 Для простоты дальнейшего изложения введем следующие обозначения:

'У.х [г ]- Ух (г, х ( г ), и (г)) ,

Нх [I]-Нх (г, х (г), и (г), у(г)) ,

Ди(г Н [г ]- Н (г, х (г), и (г), у(г))-Н (г, х (г), и (г), у(г)) ,

Д(г )Нх [г ] - Нх (г, х (г), и (г), у (г))- Нх (г, х (г), и (г), у(г)) .

Отсюда, используя формулу Тейлора, с учетом введенных обозначений тождество (10) можно записать в следующем виде

Д5 (и ) = ф (х (^ ))Дх (^ ) + у'(г -1) Дх (гг ) + £у'( г -1) Дх (г )-

г=г° (11) г1 -1 г1 -1 г1 -1 г1 -1 V '

£ К [г ]Дх (г )-£ а-(г)Н [г ]-£ д- (г) К [г ]Дх (г )-£ о1 (Д (г )||) + 02 (Д (г1 )||).

г, -1

г=г

г=г.

г=г

г=г

0

0

Здесь величины ог(.), / = 1, 2 определяются соответственно из разложения

н (г, х (г), и (г), у (г))- н (г, х (г), и (г), у (г )) = н (г, х (г), и (г), у (г ))--н (г, х (г), и (г), у (г)) + н (г, х (г), и (г), у (г))- н (г, х (г), и (г), у (г)) = = [н (г, х (г),и (г), у (г)) - н (г, х (г),и (г), у (г))] +

+ н'х (г, х (г), и (г), у (г)) Ах (г) + ^ (||Дх (г )||) = = [н (г, х (г),и (г), у (г)) - н (г, х (г),и (г), у (г))] + + [ н'х (г, х (г), и (г), у (г ))Дх (г)- н'х(г, х (г), и (г), у (г ))Дх (г)] + + н (г, х (г), и (г), у (г)) Дх (г) + ^ (||Дх (г )||) ,

ф( х (^)+дх (^)) - ф( х (^)) = Фх (х (^ )) дх (^) + о2 (||дх (^ |). Теперь предположим, что у (г) является решением следующей системы линейных однородных дробного порядка разностных уравнений

г 1)=н*1г ^г=^ tl-2,..., to,

у(^1 -1 ) = -фх (х (Ь ))• Систему (12) назовем сопряженной системой в рассматриваемой задаче (1)-(4). При выполнении соотношений (12) формула приращения (11) примет следующий вид:

г1 -1

дЯ(и) = -£д»-(он [г] + л(и; ди), (13)

г=о

где по определению

л(и; д- ) = 02 (д (^ )||) - г о (д (г )||) - £ д^ н [г ]Дх (г).

г=го г=го

Формула приращения (13) играет основную роль при выводе необходимых условий оптимальности в задаче (1)-(4).

В дальнейшем нам понадобится оценка для ||Дх (г )||. С этой целью, применяя Д-а к обеим сторонам уравнения (1), имеем

Д-аДах(г +1) = Д-а/(г,х(г),и (г)). Теперь рассмотрим выражение

Д-аДа х (г+1).

Учитывая свойства операторов дробной суммы и дробной разности проведем следующие преобразования:

Д-аДа х (г +1) = Д-а (д1-ц х (г +1)) = Д-аД-ц (Дх (г +1)) =

г

= Д-1 (Дх (г +1)) = ^ (х (г +1) - х (г)) = х (г +1) - х (г0).

]=го

Правая сторона будет иметь вид:

Д-а/(г, х (г), и (г ))= * £ (г-Р( , ))(а-1) / (Л х (]), и (] )) =

V / ]=го

= 1 [ г " { + а_ 1]/ ( х ( 1 ), и ( 1 )) = 1Л( г, ] )/ ( Л х ( ] ), и ( ] ))

1=г0 V1 1 ) } = г0

Здесь

(г - ] + а-

Л (г, ] ) =

г - ]

Таким образом, мы доказали, что

t

x(t +1) = x(i0) + 2 A {t, j)f (j,x(j) ,u ( j)) ,

j =t0

и, используя условия Липшица, получаем

||Дг(t +1)1 = 2 A (t, j)||f (j,x(j),u (j))-f (j,x(j),u (j))|| =

j=t0

t

= 2Aa(t, j)||f (j,x(j),u (j))-f (j,x(j),u (j)) + Asf [j]||<

]=t0

< Ц 2 A (t, j)||x ( j) - x( j)|| + 2 Aa (t, j)\\Asf [ jI =

J=t0 J=t0

t t t = Ц 2 Aa( t, j )||Ar ( j )|| + 2 Aa(t, j )K-f [ j ]||< L +2 Aa(t, j )\\^f [ j ]|| •

J =t0 j =t0 j =t0

Применяя к последнему неравенству лемму Гронуолла-Беллмана дробного порядка, например из [1], получим оценки

t-1

(t)||<L2П(1 + Aa(t, j)|Auf [j]|), t = t0,t0 +1,...,ti. (14)

j=t0

Теперь, считая (u (t), x (t)) оптимальным процессом, введем множество

f (t,x(t),U) = {y eRn : y = f (t,x(t),o),ueU}. (15)

Множество f (t,x(t),U) называется множеством допустимых скоростей для системы уравнений (1). В дальнейшем будем предполагать, что множество (15) вдоль оптимального процесса (u(t),x(t)) выпукло. Специальное приращение оптимального управления u (t) определим по формуле

Aue(t) = o(t, е)-u (t), t eT, (16)

где s - произвольное число из отрезка [0,1], а и(t,е) e U, t e T, - произвольный вектор, такой что

At [t] = eAu(ttf [t], t eT, (П)

где t) вектор со значениями из U.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Соотношение (17) имеет место в силу выпуклости множества допустимых скоростей (15) системы (1). Через Axe (t) обозначим специальное приращение траектории x (t), отвечающее приращению AuE (t) управления оптимального u (t) . С учетом оценки (14) получаем, что

|Axe(t)|<Це, teTиt1, L3 = const >0. (18)

В этом случае из формулы приращения (13) получим справедливость следующего неравенства:

t1 -1

ASe (u ) = S (u + V ) - S (u ) = Ao(t,e)H [t] ++ 'П ("; ) =

t=t0 (19)

!1 -1 г ,

г " + л(u;

= "sZAu(t )H [t ] + «; A"s)^ o.

t=t„

Из выражения для ^ (и; Ди), в силу оценки (18) и формулы (17), вытекает, что

и; Дие) = о(е).

Следовательно, неравенство (19) можно записать в следующем виде:

ti -1

-еЕА»«н М+°(Ф0 • (20)

t =t0

Отсюда в силу достаточной малости и произвольности s следует неравенство

ti-1

)H [t 0 • (21)

t=to

Таким образом, доказано следующее утверждение.

Теорема (дискретный принцип максимума). Если вдоль допустимого процесса (u (t),x(t)) множество допустимых скоростей f (t,x(t),U) системы (1) выпукло, то для оптимальности допустимого управления и (t) в задаче (1)-(4) необходимо, чтобы неравенство (21) выполнялось для всех и(t) е U , t еГ •

Неравенство (21) является условием максимума (аналогом дискретного принципа максимума) для задачи оптимального управления системой нелинейных разностных уравнений дробного порядка с заданными начальными условиями.

Заключение

В статье рассмотрена одна задача оптимального управления, описываемая системой нелинейных разностных уравнений дробного порядка. С помощью метода приращения сформулировано необходимое условие оптимальности первого порядка типа принципа максимума Понтрягина.

литература

1. Miller K., Ross B. An introduction to the fractional calculus and fractional differential equations. NewYork : Wiley, 1993. 366 p.

2. Podlubny I. Fractional differential equations. San Diego : Acad. Press, 1999. 340 p.

3. Нахушев A.M. О непрерывных дифференциальных уравнениях и их разностных аналогах // ДАН СССР. 1988. Т. 300, № 4.

С. 729-732.

4. Нахушев A.M. Дробное исчисление и его применение. М. : Физматлит, 2003. 272 с.

5. Kilbas A.A., Srivastava H.M., Trujillo J.J. Theory and Applications of Fractional Differential Equations. Amsterdam : Elsevier,

2006. 523 р.

6. Samko S.G., Kilbas A.A., Marichev O.I. Integrals and derivatives of fractional order and some of their applications. Minsk : Nau-

ka i Tekhnika, 1987. 688 р.

7. Goodric C., Piterson A.C. Discrete fractional calculus. New York : Springer, 2015. 556 р.

8. Розоноэр Л.И. Принцип максимума Л.С. Понтрягина в теории оптимальных систем. I // Автоматика и телемеханика. 1959.

Т. 20, вып. 10. C. 1320-1334.

9. Пропой А.И. Элементы теории оптимальных дискретных процессов. М. : Наука, 1973. 258 с.

10. Мансимов К.Б. Дискретные системы. Баку : Изд-во Бакинского гос. ун-та, 2002, 114 с.

Поступила в редакцию 17 июля 2020 г.

Aliyeva S.T. (2021) THE PONTRYAGIN MAXIMUM PRINCIPLE FOR NONLINEAR FRACTIONAL ORDER DIFFERENCE EQUATIONS. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitelnaja tehnika i informatika [Tomsk State University Journal of Control and Computer Science]. 54. pp. 4-11

DOI: 10.17223/19988605/54/1

Consider the following system of fractional order nonlinear difference equations a

Aax(t +1) = f (t,x(t),u(t)) t eT = {t0,t0 + 1,...,t1 -1} (1)

with initial conditions

xfo ) = x0. (2)

Here x(t) is the «-dimensional vector of phase variables, u(t) is the r-dimensional vector of control actions, are given,ft, x, u) is the given «-dimensional vector function, whose components f (i = 1, «) are continuous in the aggregate of variables together with

partial derivatives in the phase variables \ L i, j = 1,« .

[dxy J

A control u(t) = [u(t0 j,u(t0 +1),...,u(tt -1)} is called an admissible control if it satisfies the constraint

u (t )eU c Rr, t eT. (3)

Here U is the given nonempty bounded set.

On the solutions x (t) = [x (t0), x (t0 +1),..., x (tt)} of system (1)-(2) generated by all possible admissible controls, we define the functional

5(u) = 9(x(t1)). (4)

Here x) is a given scalar function continuous with ^ (x) .

An admissible control u(t) delivering a minimum to functional (4) under constraints (1)-(3) is called an optimal control, and in

this case, a pair (u (t), x(t)) is called an optimal process.

In what follows, the minimum problem of functional (4) under constraints (1)-(3) will be called problem (1)-(4). Our goal is to derive the necessary optimality conditions in the problem under consideration.

Keywords: permissible control; optimal control; fractional order difference equation; Pontryagin maximum principle.

ALIYEVA Saadat Tofig (Candidate of Physics and Mathematics, Associate Professor, Baku State University, Department of Mathematical Cybernetics, Azerbaijan, Baku). E-mail: [email protected]

REFERENCES

1. Miller, K. & Ross, B. (1993) An Introduction to the Fractional Calculus and Fractional Differential Equations. NewYork: Wiley.

2. Podlubny, I. (1999) Fractional Differential Equations. San Diego: Acad. Press.

3. Nakhushev, A.M. (1988) Onepreryvnykh differentsial'nykh uravneniyakh i ikh raznostnykh analogakh [On continuous differential

equations and their difference analogs]. DANSSSR. 300(4). pp. 729-732.

4. Nakhushev, A.M. (2003) Drobnoe ischislenie i egoprimenenie [Fractional calculus and its application]. Moscow: Fizmatlit.

5. Kilbas, A.A., Srivastava, H.M. & Trujillo, J.J. (2006) Theory and Applications of Fractional Differential Equations. Amsterdam:

Elsevier.

6. Samko, S.G., Kilbas, A.A. & Marichev, O.I. (1987) Integrals and Derivatives offractional Order and Some of Their Applications.

Minsk: Nauka i Tekhnika.

7. Goodric, C. & Piterson, A.C. (2015) Discrete Fractional Calculus. Springer International Publishing. DOI: 10.1007/978-3-319-

25562-0

8. Rozonoer, L.I. (1959) Printsip maksimuma L.S. Pontryagina v teorii optimal'nykh sistem. I [L.S. Pontryagin's maximum principle

in the theory of optimal systems. I]. Avtomatika i telemekhanika - Automation and Remote Control. 20(10). pp. 1320-1334.

9. Propoy, A.I. (1973) Elementy teorii optimal'nykh diskretnykh protsessov [Elements of the Theory of Optimal Discrete Processes].

Moscow: Nauka.

10. Mansimov, K.B. (2002) Diskretnye sistemy [Discrete Systems]. Baku: Baku State University. Baku.

i Надоели баннеры? Вы всегда можете отключить рекламу.