Научная статья на тему 'Численный метод решения одной двухэтапной динамической задачи стохастического программирования'

Численный метод решения одной двухэтапной динамической задачи стохастического программирования Текст научной статьи по специальности «Математика»

CC BY
267
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТОХАСТИЧЕСКОЕ ПРОГРАММИРОВАНИЕ / ДВУХЭТАПНАЯ ДИНАМИЧЕСКАЯ ЗАДАЧА / СТОХАСТИЧЕСКИЙ КВАЗИГРАДИЕНТ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / STOCHASTIC PROGRAMMING / TWO STAGES DYNAMIC PROBLEM / A STOCHASTIC QUASIGRADIENT / OPTIMUM CONTROL

Аннотация научной статьи по математике, автор научной работы — Мирзоахмедов Ф., Насков Д. С.

В статье приведена постановка одной двухэтапной динамической задачи стохастического программирования, для решения которой предлагается модифицированный метод стохастических квазиградиентов с проектированием. Доказано существование стохастического квазиградиента целевой функции F(x) и сходимость предложенного метода решения задачи.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Numerical method of the decision of one of two stages dynamic problem of stochastic programming

Statement of one of two stages dynamic problem of stochastic programming for which decision authors offer the modified method of stochastic quasigradients with design is given in article. Existence of a stochastic quasigradient of function F(x) and convergence of an offered method of the solution of a task is proved.

Текст научной работы на тему «Численный метод решения одной двухэтапной динамической задачи стохастического программирования»

ДОКЛАДЫ АКАДЕМИИ НАУК РЕСПУБЛИКИ ТАДЖИКИСТАН ____________________________________2012, том 55, №9_______________________________

ПРИКЛАДНАЯ МАТЕМАТИКА

УДК 519.856

Ф.Мирзоахмедов, Д.С.Насков

ЧИСЛЕННЫЙ МЕТОД РЕШЕНИЯ ОДНОЙ ДВУХЭТАПНОЙ ДИНАМИЧЕСКОЙ ЗАДАЧИ СТОХАСТИЧЕСКОГО ПРОГРАММИРОВАНИЯ

Институт математики АН Республики Таджикистан

(Представлено академиком АН Республики Таджикистан З.Д.Усмановым 06.08.2012 г.)

В статье приведена постановка одной двухэтапной динамической задачи стохастического программирования, для решения которой предлагается модифицированный метод стохастических квазиградиентов с проектированием. Доказано существование стохастического квазиградиента целевой функции ¥(х) и сходимость предложенного метода решения задачи.

Ключевые слова: стохастическое программирование - двухэтапная динамическая задача - стохастический квазиградиент - оптимальное управление.

Постановка задачи. Требуется найти решение следующей двухэтапной динамической задачи стохастического программирования:

т

Р(х) = X ¡X + Mg(х, в) ^ тах , (1)

П

У X < R,0 < x < Г,i = 1,2,..., п , (2)

T m п m

' c,.

g(x, в) = min У (XX ct] (t)vi} (t) + У Щ (t)У (t) + У p j(t)zj(t)) • (3)

{vy.y— t=i i=i j=i i=i j=i

Здесь множество D(x, 9) задано соотношениями:

т ____

У, 0 +1) = У, 0) “X У; (* X У, 0) > 0, у, (1) = х, а 0) > 0, ^) > 0, г = 1,..., п I = \,Т , (4)

1=1

т ___

X У; () + ^ () = в;((), ^ () > 0, ^(() > 0, 0 - У; () - Г (Г), 1 = 1 п • (5)

г=1

В рассматриваемой задаче случайная величина 9/0 определяется согласно эмпирической функции распределения.

Задача (1)-(5) является двухэтапной динамической задачей стохастического программирования [1]:

1=1

1=1

П

Адрес для корреспонденции: Мирзоахмедов Фахриддин, Насков Дильшод Сайдуллоевич. 734063, Республика Таджикистан, г. Душанбе, ул. Айни, 299/1, Институт математики АН РТ. E-mail: mirfakh@mail.ru; dnaskov@bk. ru.

Задача первого этапа

¥(х) = (I, х) + Mg(х, в) ^ тах,

(6)

где х - искомые переменные; О - компакт из Еп; в = (в (1), ..., в (Т)) - случайная величина; g(х, в) -минимальные затраты на проведение коррекции при фиксированных х и воздействие параметров в .

Задача второго этапа

Здесь ограничения (8) выполняются с вероятностью 1; у(0 и у(0 - конечномерные векторы (размерность их может не совпадать); А($, в (0), £(/, в (¿)) - матрицы, зависящие только от ^ и параметров в (0; множество У(^, в (¿)) - выпуклое и компактное при каждом в (0 не зависит ни от х, ни от у(0. Параметры в(/), / = 1, Т — 1 считаются случайными к моменту принятия исходного решения, а

закон их распределения известен. Истинные значения параметров в (0 становятся известными к моменту времени ¿.

Теорема 1. Управление у*(0, I = 1, Т при фиксированных (х, в) будет оптимальным управлением процесса, описанным соотношениями (7)-(8), тогда и только тогда, когда существуют такие векторы и(1),...,и(Т), связанные соотношениями:

(и(і +1), Б(і, в(г)\ (і) - (с(і), V* (і)) = тах (и(і +1), Б(і, в(і))ув)) - (с(і), Ув))) • (10)

Доказательство теоремы основано на том, что векторы и(1), ..., и(Т) будут решением задачи, двойственной к (7)-(8). При этом и(1), и(2), ..., и(Т) являются векторами двойственных переменных, соответствующих ограничениям (8). Из справедливости теоремы 1 следует справедливость следующих следствий.

Следствие 1. Оптимальное управление у*(ґ) и векторы и(1), ..., и(Т) не зависят от х - начального состояния процесса, описанного соотношениями (7)-(8).

Следствие 2. Пусть в (8) матрица А не зависит от в (ґ). Тогда векторы и(1), ..., и(Т) также не зависят от в(1), ..., в (Т) и для определения у*(ґ) достаточно иметь информацию только о величине о(ґ), но не о величинах в (ґ + 1), ..., в (Т).

Соотношения (9),( 10) позволяют при любых х, о находить точное решение коррекционной задачи (7)-(8) и двойственной к ней. Следовательно, на основе теоремы 1 для решения задачи первого этапа (6) применим модификацию метода стохастических квазиградиентов с проектированием [2].

С Т-1

Л

(7)

где множество Ж образовано соотношениями

у(ґ+1) = А(ґ, в (ґ))у(ґ) + В(ґ, в (ґ)) у(ґ) , у(1) =х, у(ґ)е У(ґ, в(ґ)), і = 1; Т -1.

(8)

и(ґ)=и(ґ+1)А(ґ, в (ґ))-^ґ), и(Т)-ё(Т), Г = 1, Т-1,

(9)

у(і )єЖ (і, в(і))

Теорема 2. Стохастическим квазиградиентом функции F(х) (1) будет вектор Т=/+иж(1), где и"(1) - вектор, определённый согласно (9), при в = в s-s-му независимому наблюдению над реализацией случайных параметров задачи (6)-(8).

Доказательство. Поскольку векторы и(1),...,и(Т) - это оптимальные значения двойственных переменных, справедливо соотношение

т—1

g(х, в■) = X ((0(1), и * (г)) + (Л0 +1), у *(г +1)) — (и-(1), х) + (и-(Т), у * (Т))) +

I =0

Т— 1 Г-1

+Х (и- (г)—и- (г +1)Л(г, ^ (г)), У * (г)) —X (и- (г+1), В(г, в(г))у * (г)).

1=1 г=1

Отсюда и из (15) следует, что

g (х, в-) = X (с( г), V *(г)) +Х (Л (г+1), У *('))—(1). х)—("‘ (Т), у *(Т))+

г=1 г=1

+Х (и- ( г)—и- (г +1) Л(г, в- (г)+Л (г +1), у *( г +1)) —X (Л (* +1), у * (* +1)) —

г=1 г1

Т—1 Т—1 Т—1

- /

—X(и-(г +1),В(г,в-(г))у*(г)) = Х«0, V*(г))—(и'(1),х) —X(а*(г +1), В(г,в'(г))у*(г)).

г=1 г=1 г=1

Поскольку (как это уже отмечалось) ни и“(1), ни у*(0 не зависят от х, то обобщённый градиент функции g(х, в) имеет вид рх (х, в) = —и- (1), отсюда

М(Т /х0,...,х-) = Рх(х-), (11)

что и требовалось доказать.

В этом случае модификацией метода стохастических квазиградиентов с проектированием [3], использующего полученную формулу определения стохастического квазиградиента функции ¥(х), будет следующий алгоритм решения задачи (6) - (8).

Алгоритм. Пусть х0 - произвольный вектор из Еп, опишем процедуру построения хя+1 по известному хЯ, 8 = 0,1, ••••

1. Генерируем в я _ s-e независимое наблюдение над реализацией случайных параметров модели в , определяем А(}, в 8(0) и Б^, в

2^ Вычисляем и5(1), ••• ,ия (Т) по формуле

и5 (Т) = -ад и5 (¿) = и5 (¿+1) А((, в 5(0), г = Т —1,1 •

3. Находим стохастический квазиградиент Т функции по формуле

Т = / + и5(1), 8=0, 1, ••• • (12)

4. Определяем хя+1 согласно процедуре

х8+1 = Ях(х5 + р^), 8 = 0, 1, ••• • (13)

Здесь множество X образовано ограничениями (2); - — номер итерации; х° — начальное приближение - произвольный покомпонентно ограниченный вектор; р- -шаговый множитель; Т - стохастический субградиент функции ¥(х) в точке х-, то есть М(Т / ) = ¥, (х-); ж(у-) — оператор проектирования точки у- = х- — рТ на X или отыскания такой точки 2 = ^ (у-), 2 е X, что

пх (ys) = argmin

in {

x-yl / xє X

}■

z - У

<

x

- y\\2, x є X.

(14)

В том случае, когда X — многогранное множество, операция проектирования равносильна решению задач квадратичного программирования (14), один из методов решения которых рассмотрен в [3].

Для численной реализации метода (13) в условиях ограниченной разрядности сетки ЭВМ необходимо, чтобы

% s < с < да с вероятностью 1.

(15)

Если это не выполняется, то в (13) вместо направления ^s используется направление y£s, где ys — нормирующий множитель, вводимый для того, чтобы p£s было ограниченным с вероятностью 1; ys можно определить так: ys= а/ i^s , где а - ограниченная константа. При доказательстве

сходимости метода (13) для простоты выкладок рассмотрим только тот случай, когда выполняется (15). Логика доказательства сходимости в случае, когда используется нормирующий множитель, не будет отличаться от логики доказательства в случае (15). Прежде чем доказать сходимость метода (13), рассмотрим условия сходимости прямых численных методов, основанных на справедливости следующего утверждения.

Лемма 1. Пусть последовательность |xs (w)} , задаваемая алгоритмом вида (13), и мно-

жество решений X * таковы, что выполняются следующие условия:

А1. Для любой последовательности |xSi (®)j q такой, что lim xSk (w) = x *(w) e X*,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Vwe B ^Q, P(B) > 0 ^ lim xSk+1 (w) — xSk (w)|| = 0, VweÄ

А2. Существует замкнутое ограниченное множество У такое, что |х- (®)| ^ V почти

V© с вероятностью 1.

2

А3. Для V{ xSk (©)} такой, что для некоторого B Q, P(B) > 0, при каждом ©є B, lim xSk (©) = x'(©)eX * для V© є B ^ Q, P(B ) > 0 3£0 (©) > 0, что почти при каждом ©є Bx

к^да

для всех s<s0 (©) и Vr величина mk (©) < да, где mk (да) = min {m :| xm (©) - xSk (©)| >^}.

А4. Существует непрерывная функция W(x), принимающая на X * не более чем счётное множество значений, такая, что lim W(xmt(©)) < lim W(xmt(©)), V©є Bl. Тогда с вероятностью 1

к^да к^да

существует предел № (х- )}"0 такой, что любая сходящаяся подпоследовательность из {х- (©)} сойдётся к X * с вероятностью 1.

Справедлива следующая теорема сходимости последовательности {х-} , построенной со-

гласно (13)

ад ад ^

Теорема 3. Пусть выполняется р^ 0, Xр = да, X Рр < да, Т -|| — с < да. Тогда с веро-

-=0 -=0

ятностью 1 почти V© все предельные точки последовательности {х-} принадлежат X * —

множеству решений задачи (1),(5).

Доказательство. При доказательстве теоремы 3 используется понятие мартингала. Мартингалом называется такая случайная последовательность {^}ж_0, что М(и-+1 /Ц0,...,М-) существует и

М СЧ+1 / М0...Л ) = и, - = 0,1 ... •

В работе [4] было доказано, что если 0(р-) < с < ад для любого - и {и}х=0 — мартингал, то

{U L-o сходится с вероятностью 1. В частности, если Us имеет вид: jus = Zß , где

t=0

M (Д+1 / äo,..., ß ) = 0, то для того, чтобы с вероятностью 1 существовал lim jus , достаточно, чтобы

s^w

ад

ряд ZM(ß2s ) сходился.

s=0

Проверим выполнение условий А1-А4 леммы 1 для последовательности {xs | , построен-

ной согласно (13), множества точек минимума функции F(x) на множестве X и функции

W (x) = min

x *єх *

x - x *||2

Из равномерной непрерывности операции проектирования [3] и условия (15) следует, что с

вероятностью 1 выполняется

xs+1 - x'

2

— ср, с < ад, откуда непосредственно следует выполнение

условия А1. Отметим также, что согласно (13) при - = 0,1,..., с вероятностью 1 х- е X — компактному множеству, поэтому выполняется условие А3. Докажем от противного.

S

x' -x'

Пусть условие А3 не выполняется, то есть 3В1 ^ О, Р(В1 ) > 0 и такая {х} , что

< £, Vs, V© е В, х- — х' е X * для достаточно больших - . Тогда в силу непрерывности

к—ад

¥(х),33 > 0, что для достаточно больших - :

¥(х-) — ¥(х*) >3 (16)

Из свойства операции проектирования следует, что почти V© выполняется следующее:

Ж (х-+1) = тт||х-+1 — х *||2 =||х-+1 — х *(х-+1)||2 — |х-+1 — х *(х- )||2 — |х- — рТ — х *(х-)||2, (17)

x*eX *11

где x*(x) = argmin{||x — x*|| /x*eX*|.

Из (17), определений стохастического квазиградиента и обобщённого градиента выпуклой функции вытекает, что

<

W(xs+1) <||x' - x * (x') 2 -2ps (Fx(x'), x' - x * (x')) + p2sc + 2ps (Fx(x') - , xs - x * (x)) <

(18)

x- -x*(x'^|2-2p,(F(x' -F(x*(x'))) + p;c++2p,(Fx(x2),x' -x*(x'))

почти V© е В. В выражении (11) ¥х(х-) - обобщённый градиент функции ¥(х) в точке х- • Из формул (17) и (18) имеем:

S S S

W (x'+1) < x-k - x *( x’k) 2 - 2S^p, + c£p,2 + 2^p, (Fx (x')-f, x' - x *( x ')) (19)

'='k '='k '='k

почти для V © е В .

Заметим, что в силу определения стохастического квазиградиента

М(р-х (х-) — Т, х — х * (х-)) / В- = 0 • (20)

ад

Поскольку согласно последнему равенству ряд X Р (¥ х (хх) — Т, х х — х * (хх)) будет мартин-

г=0

ад

галом [4], он сходится с вероятностью 1, еслиXA2 <ад. Учитывая, что остатки сходящихся рядов

г=0

ад

стремятся к 0 с вероятностью 1, если X Рр < ад. Учитывая, что остатки сходящихся рядов стремятся

'=0

к 0, а ряд X Р, согласно условиям теоремы, расходится, то из (19), при достаточно больших -к,

имеем

да

W (xs+1) < W (xSk)—S]T pt (21)

почти Vö G B •

Последнее противоречит (при достаточно больших 5) неотрицательности W(x) . Поэтому условие A3 выполняется и найдется такая последовательность {xmtj , что

I )k=0

xm — xs4 > e, \\xmk—1 — x 41 < e (22)

почти VöG B и для достаточно малых e.

Из выражения (22) следует, что оценка (21) справедлива и для подпоследовательности

mt —1

{ч ад k

xmk j . Так как e < xmk — xSk < Rc^ p,R < ад, то из (21) вытекает W(xmk) < W(xSk) — eS / Rc,

t=sk

откуда непосредственно следует выполнение условия A4.

Заметим, что функция W(x) = min {||x — x *|| / x* G X *j на X * принимает единственное значение - нуль.

Условия А1-А4 выполняются, поэтому согласно лемме 1, любая сходящаяся подпоследовательность сойдётся с вероятностью 1 к x * - одной из точек множества X * .

Теорема доказана.

Поступило 06.08.2012 г.

ЛИТЕРАТУРА

1. Ермольев Ю.М., Гуленко В.П., Царенко Т.И. Конечноразностный метод в задачах оптимального управления. - Киев: Наукова думка, 1978, 198 с.

2. Мирзоахмедов Ф. - Кибернетика, 1984, № 6, с.71-73.

3. Мирзоахмедов Ф. Математические модели и методы управления производством с учетом случайных факторов. - Киев: Наукова думка, 1991, 225 с.

4. Лоэв М. Теория вероятностей. - М.: Изд-во иностр. лит-ры, 1962, 385 с.

Ф.Мирзоахмедов, Д.С.Насков

ОИДИ ХДЛЛИ МАСЪАЛАИ ЯК УСУЛИ АДАДИИ ДУМАР^ИЛАГИИ ВА ДИНАМИКИИ БАРНОМАСОЗИИ СТОХАСТИКИ

Институти математикаи Академияи илмх;ои Цум^урии Тоцикистон

Дар макола гузориши масъалаи думархдлагии динамикии барномасозии стохастикй ва хдлли он тавассути методи дигаргунсохташудаи квазиградиентй стохастикй бо проектсия дода шудааст. Мавчудиёти квазиградиенти стохастикии функтсияи максад F(x) ва наздикшавии методи хдлли масъала исботи худро ёфтааст.

Калима^ои калиди: барномасозии стохастики - масъала^ои динамики думаруилагии - квазигради-ентии стохастики - идоракунии муносиб.

F.Mirzoakhmedov, D.S.Naskov NUMERICAL METHOD OF THE DECISION OF ONE OF TWO STAGES DYNAMIC PROBLEM OF STOCHASTIC PROGRAMMING

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Institute of Mathematics, Academy of Sciences of the Republic of Tajikistan

Statement of one of two stages dynamic problem of stochastic programming for which decision authors offer the modified method of stochastic quasigradients with design is given in article. Existence of a stochastic quasigradient of function F(x) and convergence of an offered method of the solution of a task is proved.

Key words: stochastic programming - two stages dynamic problem - a stochastic quasigradient - optimum control.

i Надоели баннеры? Вы всегда можете отключить рекламу.