Научная статья на тему 'Достатнi умови iснування оптимального керування з оберненим зв'язком для деяких класiв систем стохастичних диференцiальних рiвнянь'

Достатнi умови iснування оптимального керування з оберненим зв'язком для деяких класiв систем стохастичних диференцiальних рiвнянь Текст научной статьи по специальности «Математика»

CC BY
56
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
СТОХАСТИЧНI ДИФЕРЕНЦIАЛЬНI РIВНЯННЯ / IСНУВАННЯ ОПТИМАЛЬНОГО КЕРУВАННЯ / КЕРУВАННЯ З ОБЕРНЕНИМ ЗВ'ЯЗКОМ

Аннотация научной статьи по математике, автор научной работы — Самойленко О.О.

Доведено iснування оптимального керування з оберненим зв’язком для систем стохастичних диференцiальних рiвнянь на необмеженому промiжку часу в термiнах коефiцiєнтiв вихiдної системи. Результат був отриманий без використання методу динамiчного програмування Беллмана та принципу максимуму Понтрягiна. Для доведення використовувались прямi методи розв’язання екстремальних задач.Доведено iснування оптимального керування з оберненим зв'язком для систем стохастичних диференцiальних рiвнянь на необмеженому промiжку часу в термiнах коефiцiєнтiв вихiдної системи. Результат був отриманий без використання методу динамiчного програмування Беллмана та принципу максимуму Понтрягiна. Для доведення використовувались прямi методи розв'язання екстремальних задач.Доведено iснування оптимального керування з оберненим зв'язком для систем стохастичних диференцiальних рiвнянь на необмеженому промiжку часу в термiнах коефiцiєнтiв вихiдної системи. Результат був отриманий без використання методу динамiчного програмування Беллмана та принципу максимуму Понтрягiна. Для доведення використовувались прямi методи розв'язання екстремальних задач.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Достатнi умови iснування оптимального керування з оберненим зв'язком для деяких класiв систем стохастичних диференцiальних рiвнянь»

УДК 517.977

Достатш умови юнування оптимального керування з оберненим зв'язком для деяких клас1в систем стохастичних диференщальних р1внянь

0. О. Самойленко

Кшвський нацюнальний ун1венрситет iM. Тараса Шевченка, Ки1в 03022. E-mail: anelka.s@mail.ru

Анотащя. Доведено 1снування оптимального керування з оберненим зв'язком для систем стохастичних диференщальних р1внянь на необмеженому пром1жку часу в термшах коефщ1ент1в вих1дно! системи. Результат був отриманий без використання методу динам1чного програмування Беллмана та принципу максимуму Понтряпна. Для доведення використовувались прям1 методи розв'язання екстремальних задач.

Ключов1 слова: стохастичш диференц1альн1 р1вняння, 1снування оптимального керування, керування з оберненим зв'язком.

1. Вступ

В даннш работа розглядаеться задача оптимального керування системою стохастичних дифференщальних р1внянь

| dx = (A(t)x(t) + f (t,x(t),u(t,x))dt + a(t, x(t),u(t, x))dW(t), 1 x(0) = xo

З критер1ем якост

oo

J(u) = E J L(t, x, u(t, x))dt — inf, (1.2)

o

де x0 — фжсований вектор, t € [0, то), x € Rd, u(t,x) € Rm — керування з оберненим зв'язком, f (t,x,u) — вектор i3 Rd, A(t) — квадратна матриця вим1рност1 d, a(t,x,u)-dx r — вимiрна матриця, W(t) — стандартний вiнерiвський процес вимiрностi r з незалежними компонентами, визначений на деякому ймовiрнiсному просторi (Q,F,P) при t > 0. Бiльш точна постановка буде дана в основнiй частинi роботи.

Дана задача розглядалася в роботах багатьох авторiв, вщмггимо лише деяю роботи [6], [12], [4], де е обширна бiблiографiя, в яких розглядалася система стохастичних диференщальних рiвнянь (1.1) з критерiем якост вигляду

т

J(u)= е{ / Us,x,u)ds + Ф(гМг))} - inf

0

де х € Q — обмежена область, а т — момент першого виходу розв'язку х(Ь) 1з Q. Для доведення юнування оптимального допусимого керування автори використовують метод динам1чного програмування. даний метод вимагае розв'язку вщповщного р1вняння

© О. О. САМОЙЛЕНКО

Беллмана, що е досить складною задачею. Тому представляв 1нтерес отримання умов 1снування оптимального керування стохастичними системами без розв'язку р1вняння ди-нам1чного програмування, а використовуючи прям1 методи розв'язання екстремальних задач. При цьому досить важко отримати таю умови в терм1нах коеф1ц1ент1в вих1дно'1 системи 1 функцп Ь, що входить в критер1й якост1 (1.2). В цьому напрямку в1домо досить мало результат1в. Так в роботах [7], [6] з використанням стохастично'1 експоненти отриман1 под1бн1 умови при в1дсутност1 керування в стохастичному член1. В робот1 [10] ц1 результати узагальнен1 на випадок дробового в1нер1вського процесу, зновву ж таки при входженн1 керування лише в коеф1ц1ент зносу. В наш1й робот1 можливе керування 1 в стохастичному член1.

Робота складаеться 1з вступу, додаткових ведомостей, постановки задач1 1 основного результату.

2. Додатков1 в1домост1

Нехай (О,, Г, Р) — ймов1рн1сний прост1р, С — деяка ст-алгебра, С С Г, £ — випадкова величина, Е(£ \ С) — умовне математичне спод1вання £ в1дносноо С. Тод1 в1домо ([3, ст. 115]), що сп1вв1дношення

Е(пЕ{£ \ С}) =

виконуеться для дов1льно'1, обмежено'1, С-вим1рно'1 випадково'1 величини п повн1стю визна-чае умовне математичне спод1вання випадково'1 величини £ в1дносно ст-алгебри С.

В дан1й робот1 слабкий розв'язок задач1 Кош1 (1.1) ми розум1емо в сенс1 наступного означення.

Означення 1. Якщо 1снуе такий ймов1рн1сний прост1р (О, Г, Р) на якому можна задати процес броун1вського руху Ш(Ь) для Ь € [0,Т] 1 випадковий процес {х(Ь), Ь € [0,Т]} так, що з ймов1рн1стю 1 мала м1сце р1вн1сть

г г

х(ь) = х0 + 1(А(г)х(г) + / (ь,х(ь),и(1,х))йв + J а(г,х(г),п(г,х))д,ш (в), о о

то даний процес будемо називати слабким розв'язком задачг (1.1).

Дамо означення оптимального допустимого керування.

Означення 2. Припустимо, що для задач1 (1.1), (1.2) 1снуе керування з оберненим зв'язком и(Ь,х), що дае розв'язок задач1 оптимального керування. Якщо х^) — роз'язок р1вняння (1.1), то и(Ь,х) = и(Ь, х(^) е оптимальним керуванням з оберненим зв'язком.

Дал1 визначимо множину випадкових процес1в МС'1ос.

Ы2'1ос = {X = X(Ь),Ь > 0}; де X — локально квадратично 1нтегровний мартингал

X(0) = 0 м.н., а також в1дображення Ь ^ X(Ь) е неперервним майже напевно. <2 Ь

Через Cb (Rd) позначимо простар обмежених, дв1ч1 неперервно диференцшовних на

R функцш.

Визначимо дал1 оператор Lu, що д1е на функцп f i3 класу Cb(Rd) наступним чином

d df 1 d ri1 f

Luf (x) = Y. fi(t,x,u) dXd) + 2 E aij (t,x,u) dx(i)dxU), (2Л)

i=1 i,j=1

x(i) — г-ий елемент вектора x, Ai(t,x,u) вщповщно г-ий елемент вектора f (t,x,u),

r

aij = ^2 ani(t, x, u)onj(t, x, u),

n=1

тобто aij — елементи матриц aaT

Нам також знадобиться означення слабкого розв'язку в мартингальнш форм^ з ви-користанням наступного результату [2, ст.160, Предложение 2.1].

Лема 1. 1снування слабкого розв'язку ргвняння (1.1) еквгвалентно гснуванню d-вимгрного неперервного процесу x(t), що задовольняе спгввгдношення

t

f (x(t)) - f (x(0)) - j Lf (x(s))ds € MÏloc (2.2

для довгльно'г функцп f € Cb

3. Постановка задач1

Отже, розглядаеться задача оптимального керування (1.1), (1.2), де u(t,x) : [0, то) х Rd ^ U, U — деяка множина iз Rm i 0 € U, вектор-функщя f (t, x, u) : [0, <ro)xRd xU ^ Rd та матриц A(t) : [0, то) ^ Rd x Rd i a(t, x, u) : [0, то) x Rd x U ^ Rd x Rr — неперервнi за сукупшстю змiнних.

Позначимо | • | — евклщова норма d — вимiрного вектора, || • || — норма матрищ, узгоджена з нормою вектора.

Будемо вважати, що для функцш f (t,x,u) та a(t,x,u) виконуеться умова лшшного росту, тобто юнуе така стала C > 0, що для будь-яких t € [0, то), x € Rd i u € U виконуеться

f (t,x,u) < C (x + Ы),

Mt,x,v,)H< C (x + |u|) (.)

та умова Лiпшица по змшнш x € Rd.

Функцiя L(t, x, u) е неперервною за сукупшстю змшних, невiд'емною та задовольняе наступну умову

L(t,x,u) < K(|x| + u)k, (3.2)

для деяких K > 0 i k > 1 i для вах x € Rd та u € U.

Визначимо множину допустимих керувань u = u(t, x) з оберненим зв'язком.

Означення 3. Допустимими керуваннями будемо вважати таю функцп u(t, x) : [0, то) х Rd — U, що

1) для u(t,x) р1вняння (1.1) з початковою умовою x(0) = xo мае слабкий розв'язок;

2) для u(t, x) виконуеться умова лшшного росту по x, тобто юнуе таке N > 0, що для будь-якого t € [0, то) i x € Rd виконуеться нер1вн1сть

\u(t,x)\< N\x\; (3.3)

3) функщя u(t, x) задовольняе по свош змiнним локальну умову Лiпшица, тобто для будь-якого R > 0 юнуе таке Kr > 0, що для будь-яких ti,t2 € [0, то) i xi,x2 € Rd таких, що \xi\ < R, \x1\ < R виконуеться умова

\u(ti ,xi) - u(t2 ,x2)\ < Kr (\ti - t2 \ + \xi - x2\).

Множину керувань, що задовольняють умови 1)-3) будемо називати множиною до-пустимих керувань для задачi (1.1), (1.2) i позначатимемо ii через V. Будемо також вважати, що матрицант X(t, s) системи

x = A(t)x. (3.4)

задовольняе наступну умову:

юнують таю константи Ki > 0 i j > 0, що мае мюце ощнка

\ X(t,s)\ < Kie-Y(t-s),t > s. (3.5)

4. Основний результат

Основним результатом дано'1 роботи е наступна теорема.

Теорема 1. Нехай для системи (1.1) з критергем якостг (1.2), виконуються умови пункту 2. Тодг якщо виконуеться умова

3KlC2(1 + N)2^^^ - y < 0, (4.1)

Y

то задача (1.1), (1.2) мае розв'язок в класг допустимих керувань V. Тобто гснуе допу-стиме керування u*(t,x) € V, що мгнгмгзуе критергй якостг (1.2).

Доведенная. Так як J(u) > 0, то юнуе невщ'емна нижня границя m значень J(u), а тому юнуе послщовшсть допустимих керувань un(t,x) € V така, що J(un) — m при n -то.

1з означення множини допустимих керувань (умова2)) випливае, що для будь-яких t € [0, то) i x € Rd: | x| < R виконуеться

sup | un(t,x) I < NI x I < NR.

n>0

отже, послiдовнiсть {un(t,x),n > 0} е рiвномiрно локально обмеженою для будь-яких t € [0, то) i x € Rd: IxI < R.

Умова 3) цього ж означення гарантуе рiвномiрну неперервнiсть ом'-1 функцiй un(t, x), t € [0, T] для довiльного T > 0 i будь-якого x € Rd, IxI < R.

Тод1 i3 послщовност {un(t,x),n > 0}, використовуючи д1агональний метод, можна видшити пiдпослiдовнiсть (яку також будемо позначати через {un(t,x),n > 0}), що збь гаеться поточково до u*(t,x), для будь-яких t € [0, то) i x € Rd.

Граничне керування u*(t,x), очевидно, задовольняе умови допустимост 2) i 3). По-кажемо, що юнуе слабкий розв'язок рiвняння (1.1) з керуванням u*(t,x).

Оскшьки керування un(t, x) допустим^ то для кожного з них юнуе слабкий розв'язок рiвняння (1.1) xn(t) i для них мае мюце наступне штегральне представлення

t t xn(t) = X(t, 0)xo + J X(t,s)f (s,xn(s),un(s,x))ds + J X(t,s)a(s,xn(s),un(s,x))dWn(s).

Доведемо рiвномiрну обмеженiсть за ймовiрнiстю розв'язкiв xn(t). Тобто покажемо,

що

Маемо

E\xn(t)\2 = E

sup P{xn(t) > R} — 0, при R -то.

no

t

X(t, 0)xo + J X(t, s) f (s, xn(s), un(s, x))ds+

t

+ J X (t, s) a (s, xn(s),un(s, x))dWn(s)

<

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

< 3E\X(t, 0)xo\2 + 3E

X(t, s)f (s, xn(s),un(s, x))ds

+

+ 3E

X(t, s)a(s, xn(s),un(s, x))dWn(s)

<

o \ n

< 3K2E\e-Ytxo\2 + 3K\C2E e-Y(t-s)(\xn(s)\ + \un(s,x)\)ds +

+ 3K2C2E j e-2Y(t-s)(\xn(s)\ + \un(s,x)\)2ds < 3K\C^E\e-Ytxo\2C-2+ + (1 + N)2^ J e-Y(t-s)\xn(s)\ds j +(1 + N)2E J e-2Y(t-s)\xn(s)\2ds^ < < 3K\C2([E\e-Ytxo\2C-2 + (1 + N)2e-2YtE( f eYs/2eYs/2\xn(s)\ds^ +

o \ n

s

+ (1 + N)2e-2YtE J e2Ys\xn(s)\2ds j < 3K\C2 ^E\e-Ytxo\2C-2+

2

t

2

t

2

+ (1 + N)2e-2YtE^ J eYS J eYS\xn(s)\2ds^j +

+ (1 + N)2e-2YtE J e2YS\xn(s)\2 ds^ < 3KfC^E\e-Ytxo\2C-2+

t t s

+ e J eYS\xn(s)\2 ds + (1 + N)2e-2YtE J e2~iS\xn(s)\2ds j <

0 0 ' 2 t t < 3K2C2e-Yt(E\xo\2C-2 + E j eYS\xn(s)\2ds + (1 + N)2E j eYS\xn(s)\2ds)

або

t

eYtE\xn(t)\2 < 3K\E\xo\2 + 3Kf C2(1 + N)2E [ eYS\x,n(s)\2ds.

7 J

0

Нехай

A = 3KfE\xo\2 B = 3KfC2(1 + N)

2п2,л t лл2 1+Y

7

Тод1 за лемою Гронуола-Беллмана маемо

eYtE\xn(t)\2 < AeBt

або

E\xn(t)\2 < Ae(B-Y)t < A.

Тому

r ,, , E\xn(t)\2 Ae(B-Y)t sup P{xn(t) > R} < sup — 2 <-Б2--^ 0' при R ^ ю.

n>0,t>0 n>0,t>0 R R

Отже, ам'я розв'язюв xn(t) е р1вном1рно обмеженою за ймов1ршстю. Покажемо тепер, що для довшьних T > 0 i е > 0 виконуеться р1вн1сть

lim sup P< max \xn(t2) — xn(t\)\ >е> = 0.

n>0 lti,t2€[0,T],|ti-t2\<h J

Використовуючи штегральне представлення

t t xn(t) = x0 + J[A(s)xn(s) + f (s'xn(s)'Un(s'xn))]ds + j a(s'xn(s)'Un(s'xn))dWn(s) 00

та нер1вност1 (2.1), (3.1) та Гельдера, маемо /

E max \xn(t2) - Xn(ti)\

tl,t2€[0,T],

V \ti-t2\<h t2

\2 /

= E max

tl ,t2&[0,T],

) V \tl-t2\<h

t2

A(s)xn(s)ds+

t2 t2 + j f (s,Xn(s),Un(s,Xn))ds + J a(s,Xn(s),Un(s,Xn))dWn(s)

tl

<

< 3E max

tl ,t2&[0,T], \ti-t2\<h

+ 3E max

tl,t2&[0,T ], \ti-t2\<h

t2

tl tl

t2

A(s)xn(s) ds

2

+ 3E max

tl,t2&[0,T ], \ tl - t2 \ <h

t2

f (s,Xn(s),Un(s,Xn))ds

tl

+

a(s, Xn(s), Un(s, Xn))dWn(s)

tl

2

<

< 3E max

tl ,t2&[0,T ] \ti-t2\<h 4tl

(<-2 \ t2

/ \A(s)\2ds]E max / \Xn(s)\2ds+ J / tl,t2&[0,T],J

tl ' \tl-t2\<h tl

( t2 \' i J \Xn(s)\dsj

tl

+ 3C2(1 + N)2eI max [ \Xn(s)\dWn(s)} < 3 max \A(s)\2(ti - t2?A+

\tl,t2&[0,T]J I tl,t2&[0,T],

4 \tl-t2\<h tl / \tl-t2\<h

+ 3C2(1 + N)2(ti - t2)2A2 + 3C2(1 + N)2eI max l \Xn(s)\dWn(s)\ <

\tl,t2&[0,T]J I

\ tl - t2 \ <h tl

h

< 3 max \A(s)\2h2A + 3C2(1 + N)2h2A2 + 12C2(1 + N)2 f E\Xn(s)\2ds <

tl,t2&[0,T], J

\tl-t2\<h 0

< 3 max \A(s)\2h2A + 3C2(1 + N)2h2A2 + 12C2(1 + N)2Ah.

tl,t2&[0,T ], \tl-t2\<h

\tl-t2\<h tl t2 \ 2

+ 3C2(1 + N )2E max [ \Xn(s)\ds +

tl,t2&[0,T], \ J '

\tl-t2\<h 4tl

t2

Тод1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

'I

sup P< max \Xn(t2) - Xn(ti)\ >e> <

n>0 I tl,t2&[0,T], \ tl - t2 \ <h

e

-2

max \A(s)\2 h2A + 3C 2(1 + N )2h2A2 + 12C 2(1 + N )2Ah

tl,t2&[0,T ], \tl-t2\<h

— 0, h — 0.

Отже, ам'я розв'язюв {Xn(t),t > 0} задовольняе умови теореми 4.2 [2, ст. 25]. Тод1 icHy-ють пiдпослiдовнiсть nk,k — то, ймовiрнiсний простiр (Q,F, P) i d — вимiрнi неперервнi

2

2

процеси {xnk(t),t > 0} та процес x*(t) таю, що xnk(t) — x*(t),nk — то за ймовiрнiстю для будь-якого t > 0, а скiнченновимiрнi розподiли xnk (t) i x*(t) спiвпадають при всiх nk > 0.

Перепозначимо послiдовнiсть {xnk(t),t > 0} через {xn(t),t > 0}.

Покажемо тепер, що x*(t) — розв'язок рiвняння, що вiдповiдае керуванню u*(t), тобто

t t x*(t)= xo + J [A(s)x* (s) + f (s,x*(s),u*(s,x*))]ds + j a(s,x*(s),u*(s,x*))dW(s), oo

з деяким вiнерiвським процесом W(t), заданим на ймовiрнiсному просторi (x,F, P). Визначимо сiм'ю операторiв

d df 1 d c)2 f

Lun f (x) = ^(Ai(t)xi + fi(t,x,uk)) дТй) +2YI aij (t,x,un)

i=1

dx(i) 1 2 ^ dxVdxU)'

i,3 = 1

Нехай Zd = C([0, то) — Rd) — простiр всiх неперервних функцiй g, визначених на [0, то), зi значеннями в Rd. Також нехай B(Zd) — a-алгебра на Kd, а Bt(Zd) — шд-a-алгебра B(Zd), порождена g(s), при 0 < s < t.

Нехай s < t, i Fi : Zd — R — обмежена, Bs(Zd) — вимiрна функщя на Wd. Також для кожно'1 функцп f € C2 (Rd) iснуе така стала R1, що для будь-якого x € Rd, i будь-яких i,j = 1, d:

df \< R \ d2f

dx(i)

\f(x)\< RЬ \\< Rb \\< R1.

Тодi маемо

E

|f (xn(t)) - f (xn(s)) - J Lukf (xn(z)) dz|

< 3E \ f (xn(t)) \2 +

+ 3E \ f (Fn(s)) \2 +3E

¿(Ai(z)xi(z) + fi(s, Fn(s),un(s, xn))) dfdxk()) +

L i=i

+ aij (z, xn(z),un(z, xn (z)))

i,j=1

d 2f (xn(t))

dx (i)dx(j)

dz

< 6R1+

+ 6E

+ 6E

un (s,x„))) dfxn(z') dz

/ ^(Ai(z)xi(z) + fi(s,xn(s),un(s,xn)))

s i=1

t d 2 J aij(z,Fn(z),Un(z,Fn(z)))д f (xn(t^

i,j=1

dx(i)dx(jy

dx(i) 2

dz

+

де aij — елементи матрицi aa

T

2

t

2

t

2

Оцшимо окремо другий i третш доданки в останнш нер1вност1. Маемо

E

'f d

/ ^2(Ai(z)%n(z) + fi(z,Xn(z),Un(z,Xn)))

с i=1

dfXn(z)

dx(i)

dz

<

< R\E ^ j J2(\Ai(z)\\Xn(z)\ + C(\Xn(z)\ + \un(z,xn)\)) dz^ <

d f * \ 2

< R\dE j \Ai(z)\\Xn(z)\ + C(\Xn(z)\ + \un(z,xn)\) dzj <

< RjdE I(\Ai(z)\\Xn(z)\ + C(1 + N)\Xn(z)\) dz^ <

d f * \ 2

< RjdE I (\Ai(z)\ + C(1 + N)) \Xn(z)\) dzj <

< R2d(t - s) ^ I(\Ai(z)\ + C(1 + N))2\Xn(z)\2dz j <

d *

< R\d(t - s)(M + C(1 + N))2^2 E \Xn(z)\2dz <

i=1 l d *

< R2d(t - s)(M + C(1 + N))2Y^ E Adz <

i=1 s

< R2d2(t - s)(M + C(1 + N))2A = R2d2(t - s)A(M + C(1 + N))

Для третього доданку аналопчно маемо:

E

т' d

/ aij(z,Xn(z),Un(z,Xn(z))) s i,j=1

92f (Xn(z))

<

< r2e

T' d

/ Eaij(z,x,n(z),Un(z,x,n(z)))dz l i,j=1

<

< m - s>Ej iJ aijьъм^ът)dz <

s \i,j=i /

* d

< Rl(t - s)d2E Y^ \aij(z,xcn(z),un(z,xcn(z)))\2dz <

l i,j=1

2

2

2

t

< Rl(t - s)d2E J \\a(z,Xn(z),Un(z,Xn(z))\\2dz <

s

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

t

< Rl(t - s)d2C2E J(E\Xn(z)\ + E\un(z,Xn)\)2dz <

s

t

< Rl(t - s)d2C2E j E(1 + N)2\Xn(z)\2dz < R2(t - s)2d2C2(1 + N)2A.

Отже,

E

t

{f (Fn(t)) - f (Xn(s)) - j LUk f (Xn(z))dz}

<

< 6R2 + R2d2(t - s)A(M + C(1 + N))2 + R2(t - s)2d C2(1 + N)2A.

1з рiвномiрноl по n обмеженост другого моменту випливае можливiсть граничного переходу в рiвностi

t

e{ (ff (x*(t)) - f (x*(s)) - j Lu* f (u*(z))dz)Fi(X*)\ =

s

= e| limjf (Xn(t)) - f (Xn(s)) - j Lun f (un(z))dz)Fi(Xn(t)) \ =

s

= nl_im E^ (f (Xn(t)) - f (Xn(s)) - I Lun f (Un(z))dz^ = 0.

Отже,

t

f (X*(t)) - f (x*(s)) - j Lu* f (u*(z))dz e M

c,loc

1з Леми випливае тепер, що x*(t) — слабкий розв'язок рiвняння (1.1), що вiдповiдае керуванню u*(t,x), для будь-якого t > 0.

Залишилось довести, що керування u*(t,x) е оптимальним. Оскiльки функщя L(t, x, u) е неперервною за всiма змiнними, то

L(t,Xn(t),un (t,Xn)) — L(t,x*(t),u*(t,x*))

Маемо

оо

J(un) = E j L(t,Xn(t),un(t,Xn))dt — m, при n — то. 0

2

Отже, для будь-якого е > 0 icHye таке N € N, що для будь-якого k > N виконуеться

оо

E J L(t,Xn(t),Un(t,Xn))dt < m + е. о

За лемою Фату маемо

о

EIut-X' < m+е.

о

Оcкiльки е ми обирали довшьним чином, то отримаемо

о

E J L(t,x*(t),u*(t,x*))dt = m = J(u*). о

Таким чином u*(t,x) e оптимальним керуванням. □

5. Висновок

Основним результатом дано!' роботи е теорема юнування оптимального керування з оберненим зв'язком для стохастичних систем диференщальних рiвнянь. Дана теорема дае достатш умови юнування оптимального керування в термiнах коефщентав вихщно!' системи, а також функцп, що входить в критерi й якость Тому, використовуючи даний результат, ми можемо впевнитись в юнуванш оптимального керування перш шж шукати його, застосовуючи, як правило, досить громiздкi методи.

Перелж цитованих джерел

1. Барсегян В. Р. Оптимальное управление линейных систем со стохастической обратной связью. — Mechanics. Proceedings of National Academy of Sciences of Armenia, 54 (2). 2001 — 63-69pp.

2. Ватанабэ С., ИкедаН. Стохастические дифференциальные уравнения и диффузионные процессы. — М.: Наука, Главная редакция физ.-мат. литературы-1986 год —448 с.

3. ГихманИ.И, Скороход А. В. Теория случайных процессов. Том 3. — М.: Наука,Главная редакция физ.-мат. литературы-1975 год —654 с.

4. Крылов Н. В. Управляемые процессы диффузионного типа. — М.: Наука-1977 год —654 с.

5. Скороход А. В. Исследования по теории случайных процессов. — Киев:Изд-во ун-та, 1961. — 216 с.

6. ФлемингУ., РишелР. Оптимальное управление детерминироваными и стохастическими системами. — М.:Мир,1978. — 216 с.

7. Benes V. E. Existence of optimal stochastic control laws. // SIAM Journal Control. — 1971. — V.9.-N3-P.446-472.

8. S.Chen and J.Yang. Stochastic Linear Quadratic Optimal Control Problems. // Appl.Math.Optim. — 2001. — 43 — p. 21-45.

9. T.Duncan T., P.VaraiyaP. On solution of a stochastic control system. // SIAM Journal Control. — 1971. — V.9.-N3 —P. 354-371.

10. P.S.KnopovP. S., O.M.Derieva O. M. On the control problem for stochastic differential equations with additive fractional brownian motion. // International conference "Modern stochastic: theory and applications September —2010 — 7-11, Kiev, Ukraine

11. J.LuoJ, FengE. Generalized differential Riccati equation and indefinite stochastic LQ control with cross term. // Appl.Math.and Computation — 155(2004) — p. 121-135.

12. Fleming W. H., SonerH. Mete . Controlled Markov processes and viscosity solutions. — New York: Springer, —2005 —p. 448.

13. Wonham W. M. Optimal stationary control of a linear system with state-dependent noise. // Appl.Math.and Computation, Proc.Nat.Acad.Sci.U.S.A. —(1967) —5 —pp. 486-500.

Получена 06.06.2013

i Надоели баннеры? Вы всегда можете отключить рекламу.