Научная статья на тему 'Исследование одного класса задач оптимального управления подвижными источниками'

Исследование одного класса задач оптимального управления подвижными источниками Текст научной статьи по специальности «Математика»

CC BY
30
5
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Теймуров Р.А.

Для решения задачи оптимального управления подвижными источниками, состояние которых описывается совокупностью уравнений параболического типа и системами обыкновенных дифференциальных уравнений, доказаны теоремы существования и единственности, установлены достаточные условия дифференцируемости по Фреше целевого функционала, найдено выражение для его градиента, получено необходимое условие оптимальности в виде интегрального принципа максимума.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Теймуров Р.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The problem of optimal control of processes described by a parabolic type equation with moving sources is investigated in the paper. A theorem on existence and uniqueness of the solution is solved for the optimal control problem. Sufficients conditions of Frechet differentiability of quality test and an expression for its gradient are obtained, necessary conditions of optimality in the form of point wise and integral maximum principles are established for an optimal control problem.

Текст научной работы на тему «Исследование одного класса задач оптимального управления подвижными источниками»

УДК 517.977

ИССЛЕДОВАНИЕ ОДНОГО КЛАССА ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ПОДВИЖНЫМИ ИСТОЧНИКАМИ

© Р. А. Теймуров

Abstract. The problem of optimal control of processes described by a parabolic type equation with moving sources is investigated in the paper. A theorem on existence and uniqueness of the solution is solved for the optimal control problem. Sufficients conditions of Frechet differentiability of quality test and an expression for its gradient are obtained, necessary conditions of optimality in the form of point wise and integral maximum principles are established for an optimal control problem.

В настоящее время, ввиду сложности решения задачи оптимального управления подвижными источниками, состояния которого описывается дифференциальным уравнением с частными производными, изучены недостаточно [1, 5]. Для некоторых классов линейных и нелинейных краевых задач, в которых участвует импульсные функции, исследованы вопросы существования и единственности обобщенного решения.

В исследуемой работе рассматривается задача оптимального управления процессами, описываемыми уравнением параболического типа с управлениями подвижных источников. Для этой задачи доказаны теоремы существования и единственности решения, найдены достаточные условия дифференцируемости по Фреше целевого функционала и получены выражение для его градиента, установлено необходимые условия оптимальности в виде точечного и интегрального принципов максимума.

1. Постановка задачи

Положим П = {(х,г):0 < х < I, 0 <КТ}, Пт = {(х,г) : 0 <х<1, 0 <г < Т}. В дальнейшем также понадобятся следующие функциональные пространства У21,0(П), Ж21,0(П), Ж21'1(П), которые введены, например, в [3].

Рассмотрим управляемый процесс, состояние которого определяется функцией и(х,Ь), удовлетворяющей уравнению

Институт Математики и Механики НАН Азербайджана ул. Ф. Агаева 9, г. Баку, Азербайджанская Республика e-mail: rafiqt@mail.ru, rafig.teymurov@gmail.com

Введение

n

(3)

с граничными условиями

их |х=о = о, пх |Х=1 = 0, 0 <г < Т,

и начальным условием

и(х, о) = р(х), 0 < х < ¡,

где а, I, Т > 0 — заданные числа; <^(х) € Ь2(0,1) — заданная функция; б(-) — функция Дирака; р(г) = (р\(г), Р2(г), ... , Ри(^) € Ц(0,Т), в (г) = (в1(г), в2(г),... , вп(г)) € ЬП(0,Т) — управляющие функции.

Пару функций $ = (р(Ь), в (г)) будем называть управлением. Для краткости обозначим Н = Ц(0,Т) х Ц(0,Т) — гильбертово пространство пар $ = (р(г),в(г)) со скалярным произведением

т

< $1,$2 >н = I[р1(г)р2(г) + 81(1)82(г)]йг о

и с нормой ||$||н = л/(<$,$ >н) = \](Ы\12 + \\$\\12), где $к = (рк,вк), к = I, 2. Положим

V = {(р,в) € Н : 0 < р, < А, 0 < в, < Б, < ¡,г = 1/П} ,

где А, > 0, Б, > 0, г = I, и — заданные числа и рассмотрим функционал 3($) = /0[и(х,Т) - у(х)]Чх + ЕП=1 {«1 /оТ[рк(г) - Рк

+а2 ¡0 [вк(г) - 8к(г)]2¿г

где $ = (р(г), в (г)) € Н; а1,а2 > 0, а1 + а2 > 0 — заданные параметры; у(х) € ь2(0,1), ш = (р(г),ё(г)) € н, р(г) = (р1(г), р2(г), ..., Рп(г)) € Щ(0,Т), в (г) = (§1(г), §2(г),..., вп(г)) € ЬП(0,Т)) — заданные функции.

Требуется найти такое управление $ = (р(г),в(г)) из множества V и функцию и(х,г), чтобы функционал (5) принимал наименьшее возможное значение при ограничениях (1)-(3).

2. Существование и единственность решения задачи

Определение 1. Задачу о нахождении функцию и(х,г) = и(х,г; $) из условий (1)-(3) при заданном управлении $ € V назовем редуцированной задачей. Под решением редуцированной задачи (1)-(3), соответствующей управлению

д = (р(Ь),в(1)) Е V, понимается функция и(х,Ь) Е "21,0(П), где функция и = и(х,Ь) удовлетворяет интегральному тождеству

I т I п т

! J[-Щt + а2ихГ1х}йхйг = ! (р(х)г](х, 0)<х + ^^ Рк(Ь)'п(вк(Ь),Ь)сИ, (6) 0 0 0 к=1 0 для Ч'ч = ф,г) е ш2,'1(П) и ф,т) = о.

Из результатов работ [2, 4] следует, что при каждом фиксированном д Е V редуцированная задача (1)-(3) имеет единственное решение из "210(П). Пусть выполнены все условия, принятые при постановке задачи (1)-(5). Тогда задача (1)-(5) имеет хотя бы одно решение. Следует отметить, что задача (1)-(5) при а^ = 0, ] = 1,2 некорректна в классическом смысле [8]. Однако имеет место

Теорема 1. Существует плотное подмножество К пространства Н такое, что для любого ш Е К при а^ > 0, г = 1, 2, задача (1)-(5) имеет единственное решение.

Доказательства теорем приведены в приложении.

3. Необходимые условия оптимальности

Пусть ф = ф(х,Ь) — решение из "21,0(П) сопряженной задачи

^ + а2фхх = 0, (х,Ь) Е Пт, (7)

фх |х=0 = 0, фх |х= = 0, о < г<т, (8)

ф(х,т) = 2[и(х,т) - у(х)}, 0 < х < I, (9)

где и(х,Т) — значение при Ь = Т решение редуцированной задачи (1)-(5).

Интегрируя по частям тождество

У ^ + а2фхх) П1(х,Ь)СПт = 0

Пт

получим, что функция ф = ф(х, Ь)удовлетворяет интегральному тождеству I т I

! J [ф'Пи + а2фхЩх]СхСг = 2 ! [и(х,Т) - у(х)}щ(х,Т )<Сх, (10)

0 0 0 для Ущ = щ(х,г) Е Ш1'1(П) и щ(х, 0) = 0.

Сопряженная задача (7)-(9) является смешанной задачей для линейного параболического уравнения. Поэтому из фактов, установленных для задачи (1)-(3), следует, что для каждого заданного д = (р(Ь), в(Ь)) Е V задача (7)-(9) имеет единственное решение из "21,0(П) [3, 5].

Функцию

Н (t,^,$) = - YsbKsk (t),t)Pk (t) + ®\[Pk (t) - pk (t)]2 + a2[sk (t) - sk (t)]2} (11

k=i

назовем функцией Гамильтона-Понтрягина задачи (1)-(5).

Теорема 2. Если ф(х,г) — решение сопряженной задачи (7)-(9), то функционал (5) дифференцируем по Фреше на множестве V и для его градиента справедливо соот-

ношение

где

j '$) = Ш ,jm) = (-ш - он

P s P s

дН

P

дН дН дН dpi д'р2др„,

дН

s

дН дН дsl, дs2 '

дН дsn

'12)

дН

дрк

= -ф(sk(t),t) - 2ai (рк(t) - рк(t))

дН

дsk

т— = -фx(sk(t),t^k(t) - 2а2 (sk(t) - sk(t)), k =l,n.

Теорема 3. Пусть выполнены все условия теоремы 2 и u*(x,t), ф*(х,Ь) — соответственно решения задачи (1)-(4) и (7)-(9) при $ = $* Е V. Тогда для оптимальности, управления $* необходимо выполнение условия

Н(^ф*,$*) = max Н(^ф*,$), V(x,t) Е П. (13)

Теорема 4. Для оптимальности управления $* = (р*(t), s*(t)) Е V необходимо выполнение условия

T

n „

< J'($*),$ - $* >н = W {[^*(s*k(t),t) + 2а\ (р1 (t) - pkтр(t) - fk(t)) +

k=lo

+ msk(ttt),Ы(t) + 2a2 (sk(t) - sk(t)] (sk(t) - sk(t))} dt > 0, W Е V, (14) где ф*(х,Ь) — решение сопряженной задачи (7)-(9) при $ = $* = (fl*(t), s*(t)).

Заключение

В настоящей работе решена задача оптимального управления подвижными источниками, описываемыми уравнением параболического типа. Найдены необходимые условия оптимальности и достаточные условия дифференцируемости по Фреше целевого функционала. Получены формулы для градиента функционала по управляемым параметрам, которые дают возможность применения эффективных методов оптимизации первого порядка.

Приложение

Доказательство теоремы 1. Докажем непрерывность функционала

J0($) = \\и(х,Т) - у(х)\\\2т .

Пусть A$ = (Ap, As) Е V приращение управления на элементе $ = (p,s) Е V такое, что $ + A$ Е V. Обозначим

Au = Au(x,t) = u(x,t; $ + A$) - u(x,t,$), Ask = Ask(t).

Из (1)-(3) следует, что Au(x,t) является обобщенным решением краевой задачи

n

Aut = a2Auxx + ^2[('Pk + Apk)S(x - (sk + Ask)) - Pk5(x - Sk)], (x,t) Е Qt, (П.1) k=l

Aux|x=0 = Auxlx=l = 0, t Е [0,T], (П.2)

Au|t=0 = 0, x Е [0,l], (П.3)

Докажем, что для функции Au(x,t) имеет место оценка

l|Au\\v2i.0(n) < ci \\A$\\H , (П.4)

где ci > 0 — некоторая постоянная.

Домножая обе части уравнения (П.1) на п = n(x,t) и интегрируя по частям полученной равенство, получим соотношение:

i t n t

/ / [Autn + a2Aux'qx\dxdt = ^ [Pk + Apk)n(sk + Ask, t) - Pkn(sk, t)] dt. (П.5)

0 0 k=i 0

Пусть ti,t2 Е [0,T] такие, что ti < t2. В тождестве (П.5) положим

( Au(x,t),t Е (tl,t2], п(,) \0 ,t Е [0,tlШ(t2,т],

и применяя формулы конечных приращений для функции Au(sk(t) + Ask,t) в виде Au(sk + Ask,t) = Au(sk,t) + AuSk (Sk,t) • Ask, Sk = sk + 9Ask, 9 Е [0,1],

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

получим уравнение энергетического баланса для задачи (П.1)-(П.3):

n t2

2 ||Д«(М)4(0 >0|^2 + a2 \\Aux(x,t)\\l2(П()|*=*2 = è [{(Pk + Apk)Askx

k= t?

xAux(sk,t) + ApkAu(sk,t)]dt, 345 sk = sk + 9Ask,в e {0,1]. (П.6)

Применяя неравенство Коши-Буняковского к правой части уравнения (П.6), получим

2 \\Au(xMl2m |t=t? + a2 \\Aux(x,t)H2L2(Qt) |t=t? <

n

Е[ (\\Pk\\L2(t1,t2) + \\APk \\ L2(tl,t2)) t max |Ask (t) W^^ (sk ,t)\\L2(tl,t2) +

k=1 1 2

+ \\Apk \ L2(tl ,t2) \Au(sk , t) \ L2 (t?,t2 H .

(П.7)

Несложно показать, что верны неравенства:

\\Au(sk Ml2 (ti,t2) < c2 W^Wv^n) , \\Aux(Sk ,t)\L2(ti,t2) < c3 WAu\V2?-0(n) ,

где c2 > 0,c3 > 0 -некоторые постоянные.

Но, тогда правую часть неравенства (П.7) можно ограничить сверху следующим образом

1 HAu^Ml^) It? + a2 \\Aux(x,t)\\2L2(nt) |tl < C4 HAtfH^?^ HAuH^), (П.8)

при || Д$||22¿2) ^ 0,где с4 > 0-некоторая константа. Как и в работе [4, стр.166-168], для произвольного Ь Е [0,Т] разобьем отрезок [0,Ь] на конечное число подотрезков, на каждом из которых выполняется неравенство (П.8). Затем, сложив полученные неравенства для каждого подотрезка, получим

1 \\Дф,1)\\12т + а2 \\Дих(хМ2ЫП1) < С4 ||Д0||Н ||Ди|У21.0(П) ,

откуда вытекает неравенство (П.4). Тогда ||Ди|^1,0(О) ^ 0при \\Д$\\Я ^ 0. Отсюда и из теоремы о следах [6] получим, что \\Ди(х,Т)\\Ь2(01) ^ 0 при \\Д$\\Я ^ 0. Приращение функционала 30{д) представимо в виде

т

+ Д&) - М&) = 2У[и(х,Т) - у(х)]Ди(х,Т)йх + \\Ди(х,Т)|22(о,I). 0

Отсюда и из того, что \\Ди(х,Т)\\Ь2(0 ¡) ^ 0 при \\Д$\\Я ^ 0, следует непрерывность функционала

Функционал снизу ограничен и в силу доказанного является непрерывным в V. Кроме того, Н — равномерно выпуклое и рефлексивно банахово пространство [7].

Тогда из теоремы Бидо, приведенной в работе [9], следует существование плотного подмножества K пространства H такого, что для любого ш = (p(t),S(t)) Е H при ai > 0, i = 1, 2 задача (1)-(5) имеет единственное решение. Теорема доказана. □

Доказательство теоремы 2. Рассмотрим приращение функционала

T T

A J = J (§ + A§) - J (§) = 2 J[u(x,T) - y(x)]Au(x,T )dx + j \Au(x,T )|2 dx+

0 0

(T T

2ai j [pk(t) - pk(t)]Apk(t)dt + aij\Apk\2 dt+

00 T T Л

+ 2a2 J [sk(t) - Sk(t)] • Ask(t)dt + a^'\Ask\2 dt(П.9) 00 где § = (p,s) Е V, § + A§ Е V, Au(x,T) = u(x,T; § + A§) - u(x,T; §), u = u(x,T; §).

Если в (10) положим ц1 = Au(x,t), в (П.5) положим ц = ф(x,t) и вычтем полученные соотношения, то имеем

J 2[u(x,T) - y(x)]Au(x,T)dx 0

T

= ^ [(Pk + Apk )ФЫ + Ask ,t) - Pk ф(sk ,t)]dt. (П.10)

k=i0

Ясно, что при сделанных выше предположениях по формуле Тейлора справедливо разложения:

ф(sk + Ask, t) = ф(sk ,t) + фх^, t)Ask + o(Ask).

Учитывая это, из (П.10) получим

i

J 2[u(x, T) - y(x)]Au(x, T)dx = 0

T

n „

= ^ [pk (t^x(sk (t),t)Ask + ф(sk (t),t)Apk (t)]dt + Ri, (П.11)

k=i0

где Ri = Yn=i (f0TФх(sk(t),t)Apk(t)Ask(t)dt + o(Ask)).

Ясно, что К\ = о(||Д$||я). С другой стороны из оценки (П.4) следует, что

ЦДи(хД)ЦЬ2т = О (||Д0||Я). Подставляя полученные соотношения в (П.9) имеем:

п

ДЗ = £ (Зг(к) + 32(к)) + о(|| Д$||я),

где

\И)

к=1

Т

Зг(к) = у [ф(8к(г),г) + 2а1 (рк(г) —РкШДрк(г)сИ,

о

Т

32(к) = У [фх(8к(г),г)Рк(г) + 2а2 (вк(г) — ёк(г))]Двк(ь)сН. о

Отсюда с учетом выражения функции Гамильтона-Понтрягина получим

-Ц, Д#)н + о (||Д0||я) ,

что показывает дифференцируемость по Фреше функционала (1) и справедливость формулы (12). Теорема доказана. □

Доказательство теоремы 3. Зафиксируем внутри области П точку Лебега (а, в) всех функций, входящих в условию задач (1)-(3) и (7)-(9). Пусть е > 0 — достаточно малое число и £ = {(х,г) : а — | < х < а + |,в — | < г < в + |} С П. Построим импульсную вариацию управления

Г = (p£,s£) = <

5A; 8 (x,t) E£, $*, 5A;8 (x,t) /е

где $ — некоторый постоянный вектор. Обозначим Au£ = ue(x,t) — u*(x,t), где u£(x, t) = u(x,t; $£). Тогда функция Aue удовлетворяет тождеству

i T

h[—au£n'+a2 а"£л] dxdt=

0 0 T

= [pl + Ы)n(sk + ,t) — pin(si,t)]dt, (П.12)

k=10

для Vq = n(x, t) E W2,'1(Ü) и n(x,T) = 0.

Рассуждая аналогично тому, как доказана оценка (П.4), устанавливаем, что для функции Au£(x,t) имеет место оценка

HAu-||y2i,o(Пт) < С6 ||A^e|L2(£) ,

где c6 > 0 — некоторая константа. Отсюда и из того, что (а, в) Е П является точкой Лебега, получим сходимость Au£ в V^1'0^) к нулю при е ^ 0.

Пусть ф£ = ф£ (x, t) Е У21,0(П) является решением следующего интегрального тождества

1 T I

[фе'Ци + а2ф£хЩх] dxdt = 2

u£(x, T) - y(x) + ]^Au£(x, T)

П1(х,Т)dx, (П.13)

00

для V^1 = n1(x,t) Е W2' (П) и n1(x,T) = 0. Разность ф£ — ф* удовлетворяет интегральному тождеству, аналогичному (П.13). Отсюда и из того, что Au£ ^ 0 в

V2 ' (П) при е ^ 0, получим ф£ ^ ф* в V2 ' (П) при е ^ 0. Вычислим приращение функционала (5):

T

AJ (&*) = J (ߣ) — J (&*) = 2

u*(x, Т) — y(x) + 2 Au(x, Т)

Au£(x, Т)dt+

T

T

+ 2aJ [pk (t) — pk (t)][pl (t) — p*k (t)] dt + aj [pl (t) — p*k (t)]2 dt +

k=1

T

T

+ 2a2 [sk(t) — S*(t)] [sk(t) — sk(t)] dt + a2 [sk(t) — sk(t)]2 dt

(П.14)

00 Рассуждая аналогично тому, как доказано соотношение (П.11), и используя тождество (П.13), получим

T

u*(x, Т) — y(x) + ^Au^x, Т)

Au£(x, Т)dt

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

£

k=1 '

ФМ (t),t)pk (t)Ask (t) + фм , t)Apk ] dt.

Учитывая это соотношение в (П.14), имеем

AJ(#*) = J(§£) — J(§*) = £П=1 Г [ф£Х(sk(t),t)pk(t)Ask(t)+ фМ,t)Apk] dt+

+ ЕП=1 <! 2a 1 JoT [pk (t) — pk (t) [pk (t) — pk (t) dt + aJo1 [pk (t) — pk (t)]2 dt +

oT [pI (

+ 2a2 JoT [sk(t) — sk(t)] [sk(t) — sk(t)] dt + a2 /; [sk(t) — sk(t)]2 dt\.

oT [sk (

2

Тогда из вида функции Гамильтона-Понтрягина (11) имеем

AJ($*) = - J [H(г,фе,$£) - H] dt.

£

В силу того, что ф£ ^ ф* в V)1'0^), отсюда получим формулу для вариации функционала (5):

6J($*) = l= - [H(в,ф*,$) - H(в,ф*,$*] .

£^■0 £

Из оптимальности управления $ Е V следует, что 6 J($*) > 0. Отсюда и из плотности всюду в П точек Лебега имеем справедливость соотношения (13). Теорема доказана. □

Доказательство теоремы 4■ В силу известной теоремы [2, с. 28] для оптимальности управления $* = (p*(t), s*(t)) Е V необходимо выполнение неравенства:

<J'($*),$ - $* >н> 0, W Е V. (П.15)

Используя выражение (12) градиента функционала, поставим его в (П.15), получим неравенство (14). □

Описок литературы

1. Бутковский А. Г. Теория подвижного управления системами с распределенными параметрами / А. Г. Бутковский, Л. М. Пустыльников. — М.: Наука, 1980. — 384 с.

2. Васильев Ф. П. Методы решения экстремальных задач / Ф. П. Васильев. — М.: Наука, 1981. — 400 с.

3. Ладыженская О. А. Линейные и квазилинейные уравнения параболического типа / О. А. Ладыженская, В. А. Солонников, Н. Н. Уральцева. — М.: Наука, 1976. — 736 с.

4. Ладыженская О. А. Краевые задачи математической физики / О. А. Ладыженская. — М.: Наука, 1973. — 408 с.

5. Лионс Ж. Л. Оптимальное управление системами, описываемыми уравнениями с частными производными / Ж. Л. Лионс. М.: Мир, 1972. — 416 с.

6. Михайлов В. П. Дифференциальные уравнения в частных производных / В. П. Михайлов. — М.: Наука, 1983. — 392 с.

7. Иосида К. Функциональный анализ / К. Иосида. — М.: Мир, 1967. — 406 с.

8. Тихонов А. Н. Методы решения некорректных задач / А. Н. Тихонов, В. Я. Арсенин — М.: Наука, 1974. — 286 с.

9. Goebel М. On existence of optimal control / M. Goebel. — Math. Nuchr., 1979. — Vol. 93. — P. 67-93.

Статья поступила в редакцию 28.09.2012

i Надоели баннеры? Вы всегда можете отключить рекламу.