Научная статья на тему 'О КОРРЕКЦИИ ПОЛОЖЕНИЯ СТОХАСТИЧЕСКОЙ СИСТЕМЫ ПО КВАНТИЛЬНОМУ КРИТЕРИЮ'

О КОРРЕКЦИИ ПОЛОЖЕНИЯ СТОХАСТИЧЕСКОЙ СИСТЕМЫ ПО КВАНТИЛЬНОМУ КРИТЕРИЮ Текст научной статьи по специальности «Математика»

CC BY
13
3
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Труды МАИ
ВАК
Область наук
Ключевые слова
CТОХАСТИЧЕСКОЕ УПРАВЛЕНИЕ / СТОХАСТИЧЕСКОЕ ПРОГРАММИРОВАНИЕ / ДВУХЭТАПНАЯ ЗАДАЧА / КВАНТИЛЬНЫЙ КРИТЕРИЙ / НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ / ВЫПУКЛОЕ ПРОГРАММИРОВАНИЕ

Аннотация научной статьи по математике, автор научной работы — Кибзун Андрей Иванович, Хромова Ольга Михайловна

Статья посвящена решению задачи коррекции положения стохастической системы по квантильному критерию, которая встречается в задачах управления летательными аппаратами. Рассматривается двухэтапная задача стохастического программирования с билинейной функцией потерь при нормальном распределении случайных факторов. Предложен алгоритм, основанный на решении параметрической задачи выпуклого программирования, скалярный параметр которой выбирается с помощью метода дихотомии. Полученное решение оказывается гарантирующим для исходной задачи.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Кибзун Андрей Иванович, Хромова Ольга Михайловна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О КОРРЕКЦИИ ПОЛОЖЕНИЯ СТОХАСТИЧЕСКОЙ СИСТЕМЫ ПО КВАНТИЛЬНОМУ КРИТЕРИЮ»

Электронный журнал «Труды МАИ». Выпуск № 72

www.mai.ru/science/trudy/

УДК 519.2

О коррекции положения стохастической системы по квантильному

критерию Кибзун А.И.*, Хромова О.М.**

Московский авиационный институт (национальный исследовательский университет), Волоколамское шоссе, 4, Москва, А-80, ГСП-3, 125993, Россия

*е-тай:ЫЬтип@тай. ги **е-тай:ккгото\а-(т@та11. ги

Аннотация

Статья посвящена решению задачи коррекции положения стохастической системы по квантильному критерию, которая встречается в задачах управления летательными аппаратами. Рассматривается двухэтапная задача стохастического программирования с билинейной функцией потерь при нормальном распределении случайных факторов. Предложен алгоритм, основанный на решении параметрической задачи выпуклого программирования, скалярный параметр которой выбирается с помощью метода дихотомии. Полученное решение оказывается гарантирующим для исходной задачи.

Ключевые слова: стохастическое управление, стохастическое программирование, двухэтапная задача, квантильный критерий, нормальное распределение, выпуклое программирование

1. Введение

Часто задачи управления стохастическими системами имеют мультипликативную структуру. В случае одной коррекции данная задача представляет собой двухэтапную задачу стохастического программирования. Такие задачи с критерием в форме математического ожидания (средние потери) применяются для описания и оптимизации во многих прикладных задачах [1], в частности, при управлении финансами [2], а также при управлении летательными аппаратами [3]. В этих задачах изначально выбирается стратегия первого этапа, при реализации которой возникают различные случайные факторы (возмущения). На втором этапе за счет выбора новой стратегии (стратегии второго этапа) можно частично компенсировать (корректировать) воздействие этих случайных помех. Однако во многих приложениях критерий в форме математического ожидания оказывается неудовлетворительным. Например, в задачах управления летательными аппаратами более адекватным критерием является гарантированная с заданной вероятностью точность управления [3] - квантиль. Одним из основных инструментов решения задач квантильной оптимизации оказывается доверительный метод [4], сводящий исходную стохастическую задачу к некоторой минимаксной, решение которой является гарантирующим для исходной задачи.

Двухэтапные задачи квантильной оптимизации впервые сформулированы в работе [5], в которой рассмотрена линейная функция потерь и показана эквивалентность априорной и апостериорной постановок задач квантильной оптимизации. Апостериорная постановка двухэтапной задачи, по сути, является результатом применения метода динамического программирования к двухшаговой

задаче оптимального управления. В работе [5] за счет перехода к двойственным переменным при гауссовском распределении вспомогательная минимаксная задача сведена к задаче линейного программирования. В работе [6] рассмотрена подобная постановка двухэтапной задачи стохастического линейного программирования, но для случая дискретного распределения. Стохастическая задача сводится к задаче смешанного целочисленного линейного программирования большой размерности за счет перехода к двойственным переменным. В работе [7] рассмотрена более общая, чем в [6], постановка двухэтапной задачи квантильной оптимизации, в которой случайные переменные также принимают дискретные значения. В этой работе задача сведена к задаче смешанного целочисленного линейного программирования. Особенностью получаемой в работе [7] задачи является ее большая размерность. В работе [8] предложен алгоритм решения задачи квантильной оптимизации для случая линейной целевой функции при линейных ограничениях для гауссовских случайных помех. Этот алгоритм состоит в последовательном решении задач линейного программирования, полученных из минимаксных задач для доверительного множества в виде шара.

В данной работе рассматривается двухэтапная задача квантильной оптимизации, в которой функция потерь линейна отдельно по случайным переменным и по оптимизируемым стратегиям (билинейна), а случайный вектор имеет нормальное распределение. Исходная стохастическая задача сводится к задаче выпуклого программирования, которая параметризована скалярным параметром, подлежащим выбору с помощью метода дихотомии. В результате получается гарантирующее решение исходной задачи.

2. Постановка задачи

Рассмотрим задачу управления стохастической системой в случае одной коррекции. Пусть случайный вектор X с реализациями х Е Мп имеет нормальное распределение N(0,1). Введем функцию потерь, зависящую от стратегии первого

этапа и е и с Ят и реализаций х случайного вектора X и учитывающую оптимальную стратегию второго этапа у:

Ф(и, х) = с^и + хТА1и + ^ сту, (2.1)

уеТ(и, х)

где

Т(и,х) □ {у е У: хТАйи + ст21и + ЬТу > аТх + ,^ = }, (2.2)

У А {у Е Шт^:у] > 0,] = 1,т1], с0 и с1 - заданные детерминированные вектор-столбцы размерности т и щ соответственно, матрицы А1 и А21 имеют размерность пXт, с21 , Ь и а31 - вектор-столбцы размерности т, т1 и п, соответственно, а ^ - константа.

Замечание 1. Отметим, что часть матриц А21 и векторов а31 , i = 1,7 определяющих множество Т(и, х) допустимых стратегий второго этапа у, может быть нулевыми. И тогда часть ограничений с теми же номерами ¿, соответствующими этим матрицам и векторам в множестве Т(и, х), будут являться детерминированными.

Пусть векторы с1 и Ь1,1 = 1,5, таковы, что множество

V А [у Е И5: Вту < с1, VI >0,1= ТТ}, (2.3)

компактно, где В = (Ъ1... ЪЦ)Т, а ограничения на допустимые стратегии первого этапа и являются линейными, т.е.

и ±{иЕ Ят\ Аии < Ъи}, где вектор Ъи имеет размерность къ матрица Аи имеет размерность к1 х т, причем являются такими, что и - компакт. Рассмотрим функцию вероятности:

Р(р(и) ± Р{Х\ сТи + ХТАги + Ф(и,Х) < у}, (2.4)

где Р - вероятностная мера, порожденная распределением N(0,1),

\ ( inf сТу, Г*0, Ф(и,Х) = \уег(и,х) (2.5)

{ <х>, иначе,

и функцию квантили

(ра(и) ± тт{(. Р((и) > а}, а е (0,Р*), (2.6)

где

Р* ± supP{Х. Г(и,Х) * 0}.

иеи

Сформулируем задачу первого этапа

(а = ^ (а (и),иа = аг%тт (а (и). (2.7)

иеи иеи

Замечание 2. Подобная постановка рассматривалась в работе [5]. Но в указанной работе ограничения, описывающие Т(и, х), были линейными одновременно по и и х. В рассматриваемой постановке (2.7) ограничения являются линейными отдельно по и и х (билинейными).

3. Верхняя оценка функции квантили Согласно доверительному методу [4], задача (2.7) эквивалентна следующей задаче

<а А ^^ * (Б'и)' (иа'Ба) = * (Б'и)' (3'Т

иЕи ,БЕТ(

иЕи ,БЕТ(

а

где введена функция максимума

А сТи + зир[ХтА1и + Ф(и,х)],

(3.2)

а S - доверительное множество, т.е. Б Е Та А $ Е Т:Р(Б) > а}.

Эквивалентность здесь понимается в следующем смысле [7].

Определение 1. Две задачи оптимизации будем считать эквивалентными,

если:

1) либо обе эти задачи имеют допустимые решения (с конечными значениями целевых функции), либо обе не имеют таких решений;

2) если эти задачи имеют допустимые решения, то оптимальные значения их целевых функций (конечные или бесконечные) совпадают;

3) если оптимальные значения их целевых функций конечны, то эти значения в обеих задачах либо достигаются, либо не достигаются;

4) если оптимальные значения целевых функций достигаются, то по оптимальному решению одной задачи с помощью явно описанного алгоритма указывается оптимальное решение другой задачи;

5) если оптимальные значения целевых функций конечны, но не достигаются, то по оптимизирующей последовательности стратегий одной задачи по явно описанному алгоритму указывается оптимизирующая последовательность для другой задачи.

Замечание 3. В соответствии с определением 1 выполняется <а = <а,иа = иа, причем под допустимым решением задачи (2.7) понимается пара (и, <а(и)), для

которой уа < уа(и),и е и, а для задачи (3.1) — тройка (и,5,ф(5,и)) , для которой (а < ф(5,и),5 е Та,и е и.

Зафиксируем некоторое множество 5 е Та и рассмотрим подзадачу из (3.1):

ф5 — Ш ф (5,и),иБ = а^ттф (5,и). (3.3)

иеи иеи

Рассмотрим подзадачу (2.5), для которой запишем согласно [9] эквивалентную двойственную задачу с вектором двойственных переменных V е М:

Ф(и,х) = supaT(и,х)v, (3.4)

реу

где

а(и,х) — АТ(и)х + Ъ(и) — (3.5)

— (агТ^х и А^Т\Х + С"Т^и,..., а^^х и Ат$х + $$ с^^и) , А(и) — (а'Т1 — итАт^1, ...,аТ3 — иТАт2з),

—Т

Ъ (и) = (й1 — с2Т1и, — С^и), V - выпуклый ограниченный многогранник, введенный выше в (2.3)

Пусть V1= 1,] - вершины многогранника V , являющегося выпуклым компактом. Тогда в связи с линейностью по V функции в (3.4) ее максимум на V будет достигаться в вершинах V:

Ф(и,х) = тахаТ(и,х^. (3.6)

}е1,}

Введем определение [4].

Определение 2. Множество Ка следующего вида:

Ка— Р {х: 1Тх < Ъа(1)},

где ba(l) - а -квантиль распределения случайной величины lTx , X - n-мерный случайный вектор, а Е (1/2,1) , называется a-ядром вероятностной меры P, порожденной в Мп распределением вектора X.

Известны следующие результаты [4].

Лемма 1. Если случайный вектор X имеет нормальное распределение N(0,1), то ядром уровня а является шар Spa с центром в нуле и радиусом pa, равным квантили уровня а стандартного нормального распределения N(0,1).

Лемма 2. Если Ф(и, х) выпукла по хЕ!п для всех и Е U, то для оптимального множества Sa в задаче (3.1) выполняется включение Ka с Sa.

Рассмотрим подзадачу (3.3) задачи (3.1) для фиксированного множества S, в качестве которого выбирается доверительный шар SRa с радиусом Ra и центром в нуле, P(SR) = а. Для простоты дальнейших обозначений далее будем использовать р = pa,R = Ra, если это не приведет к путанице. Теперь рассмотрим более общую задачу вида (3.3) для шара Sr с центром в нуле и переменным радиусом г Е [р, R]:

Фг = inf ф (Sr, и), ur = arg min ф (Sr, и). (3.7)

UEU UEU

где функция ф^г,и) определяется согласно (3.2) для множества Sr, т.е.

ф^г,и) А с])и + 5ир[хТАги + Ф(и,х)], (3.8)

Поскольку функция под знаком sup в (3.8) согласно (3.5) и (3.6) кусочно-линейна и выпукла по х для каждого и Е U , а шар Sr - компактное множество, то знак sup можно заменить на max. Таким образом, функция Ф^г,п) в задаче (3.7) преобразуется к виду

ф(Бг,и) — сТи + тах[хТА1и + Ф(и,х)]. (3.9)

хеБг

Исследуем задачу (3.7) с функцией максимума (3.9).

Лемма 3. Задача (3.7) является задачей выпуклого программирования и иг существует для всех г е[р,Я\..

Доказательство леммы 3.

Вначале найдем явное выражение функции ф(Бг,и) для (3.9). Поскольку вектор-функция а(и, х) линейна по х для каждого и е и, а - шар с радиусом г, то максимум в (3.9) достигается. Более того, этот максимум достигается в одной из точек касания х]г шара Бг с гиперплоскостями Г},] = 1,], которые характеризуются векторами нормали к ним,

х/ — г (А-и + А&^^/^и + А(и^\\, Г = [хТ(А1и + А(и^) = ц},] = 1], где с1 - некоторые константы, подбираемые из условия касания гиперплоскости Г и шара . Поэтому

___т

ф(Бг,и) = с^и + тах[г\\А1и + А(и^Ч\ + Ъ (и^1]. (3.10)

]=1,]

Заметим, что элементы матрицы А(и) и вектора Ъ(и) линейны по и. Следовательно, ф(Бг,и) непрерывна по и е и . Но и - компакт, поэтому оптимальная стратегия иг в задаче (3.7) существует.

Далее, проанализируем вид функции Ф(и, х). Согласно (3.5) функция, стоящая

под знаком max в выражении (3.6), линейна по и для всех х е Мп и V1,] = 1,]. Поэтому функция Ф(и, х) является кусочно-линейной и выпуклой по и еи для

каждого х. Поскольку максимум из выпуклых функций оказывается также выпуклой функцией, то согласно (3.2) функция ф(5г,и), определяемая согласно (3.9), будет выпуклой по и Е и . Следовательно, задача (3.7) является задачей выпуклого программирования. Лемма доказана.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Лемма 4. Функция фг монотонно возрастает и непрерывна по г Е [р, Л]. Доказательство леммы 4. Пусть г2 > гх, где г1,г2 Е [р, Л]. Тогда для всех и Е и согласно (3.10) имеет место неравенство

ф(5Г2,и) > ф(5Г1,и).

Следовательно,

фГ2 А штф(5Г2,и) > фп А штф(5Г1,и).

Докажем теперь, что фг непрерывна на[р, R]. Предположим противное, что в точке г1 функция фг терпит разрыв. Предположим вначале, что г1 Е [р, Л) и

Фг — Фг1 > 0 для всех г Е [г1, R]. (3.11)

Как известно [10], выпуклая на компакте функция является липшицевой. Но согласно (3.10) функция ф(5Г1,и) выпукла по и на компакте и и линейна по г для

всех и Е и, причем элементы матрицы А(и) линейны по и. Поэтому

ф(5Г)иГ1) — ф(5Г1,иГ1) = (г — г1) шах|А1иГ1 + А(иГ1)^;|| < (3.12)

)=1.}

< (г — гл) шахшахЦА-^и + А(и)уЩ = (г — гл)Ь,

иЕи ]=Т}и 11

где Ь < ю.

Выберем

г = min {R,r1 + A/(2L^}

и рассмотрим функцию ф(_Sr,uri), сравнив ее с -ri = ф(_Sri,uri) . Используя найденную выше оценку (3.12), получаем

^(Sr,UrJ-^ri < А/2-

Но —r > ^ri, т.к. г > г1 и при этом

—r = ф(Sr,ur) < ф(Sr,uri), поскольку uri - не обязательно оптимальная стратегия для -(Sr,u). Следовательно, ф,r — фr < А/2, что противоречит предположению (3.11).

Аналогично доказывается, что также не может выполняться неравенство

Фri — —r > А > 0 для всех г Е [р, г1). Таким образом, фr непрерывна на [р, R). Лемма доказана. Рассмотрим теперь задачу (3.9) для двух случаев г = р и г = R, где р - радиус ядра Ka гауссовской меры P, а R - радиус доверительного шара SR Е Та, P(SR) = а.

Для нормального распределения N(0,1) радиус R может быть найден как решение трансцендентного уравнения [4]:

R

■Jtn~1exp (—t2/2)dt = а, (3.13)

2(п-2)/2Т(п/2) о

где Г(-) - гамма-функция.

Лемма 5. Для решения задачи (3.1) имеет место следующая двусторонняя оценка

Фра — Фа — Фа(иЯа) < (3.14)

причем, фЯа — фРа ^ 0 при а ^ 1.

Доказательство леммы 5.

Вначале докажем неравенство (3.14). Согласно лемме 3 стратегия ия, где Л А существует.

Для стратегии ия согласно (3.7) верно следующее

фя = Бир[с])ик + хТА1ия + Ф(ия,х)].

ХЕБЯ

Поскольку

с {х: с])ик + хТА1ия + Ф(ия,х) < фя} (3.15)

и Р(5Й) = а, то

Р^(ик) = Р{Х: с'ик + ХТА1Щ + Ф(щ,Х) < фк} > Р(БЯ) = а.

Но по определению функции квантили

фа(ик) а шт{ф: Р<р(ик) > а}.

Отсюда следует, что <ра(ия) < фя. Поскольку ия - не обязательно является оптимальной стратегией для задачи (2.7), то уа < фа(и^а) . Следовательно, выполняется неравенство уа < фа(ща) < ф^а.

Заметим, что функция под знаком тах в (3.9) кусочно-линейна и выпукла по х для каждого и Е и. Поэтому оптимальное доверительное множество Ба согласно [4] выпукло и замкнуто. Следовательно, согласно лемме 2, а -ядро Ка содержится в выпуклом замкнутом множестве Ба, т.е. Ка с5а. Но в рассматриваемом случае Ка = , где р А ра. Поэтому в силу того, что Р(5а) > а и ф(5а, иа) = уа, получаем

ф($р,ир) < ф(Бр, иа) < ф(5а,иа) =

Поэтому верно неравенство фра — <а.

Теперь покажем, что ф^а — фРа ^ 0 при а ^ 1. Согласно [4] для X ~ N(0,1) выполняется свойство Rа — ра ^ 0 при а ^ 1. Согласно лемме 4 функция фг непрерывна на [ра, Яа]. Поэтому фКа — фРа ^ 0 при а ^ 1. Лемма доказана.

Улучшим верхнюю оценку оптимального значения функции квантили <а, выбрав значение г Е [р,Я) в задаче (3.7) такое, что <а —фг — фя. Рассмотрим для этой цели следующее множество:

Т '

Сг = [х: сТиг + хТА1иг + таха (иг,х)у] — фг} (3.16)

)Е1,}

и определим такое го, что

Го ^ Ы• [г: Р(СГ) > а}. (3.17)

ГЕ[р,И]

Заметим, что го существует, поскольку Р(СГ) > а при г = Я, т.к. Сг з Бя и Р(5я) = а. Кроме того, Р(Ср) — а при г = р, поскольку Ср содержится в одном из полупространств вероятностной с мерой а , которые образуют согласно определению 2 ядро Бр . Вначале сформулируем вспомогательное утверждение.

Пусть Сг - правильный многогранник, симметричный относительно нуля, с ] гранями, касающимися шара Бг. Сравним Сг с произвольным многогранником Сг с тем же числом граней и содержащим Бг.

Лемма 6. Если случайный вектор X имеет распределение N(0,1) , то Р(СГ) — Р(СГ) для любого г > 0 и любого ] >п + 1.

Доказательство леммы 6. Рассмотрим только такие множества Сг, все грани которых касаются Бг . В противном случае можно рассмотреть С1 с Сг, грани

которого параллельны граням множества Сг и касаются 5Г. При этом очевидно, что будет выполняться неравенство Р(Сг) ^ Р(^г) , т.к. в данном случае вероятностная мера является гауссовой, поэтому она абсолютно непрерывна относительно меры Лебега.

Далее, рассмотрим для примера случай п = 2 и / = 4. Тогда симметричным множеством Сг с четырьмя гранями будет квадрат. Причем множество Сг инвариантно относительно поворота осей координат. Пусть у многогранника Сг одна грань Г (х) отличается от грани Г(х) квадрата Сг, где х и х - точки, в которых грани касаются круга 5Г (см. рис. 1).

Рис.1 Вариация множества Сг.

Рассмотрим множества М = СДСГ и М = СГ\СГ. Грани Г(х) и Г(х) пересекаются в точке х*. Пусть М1 - множество, подобное М, которое симметрично множеству М относительно точки х*. Заметим, что ввиду симметричности М и М1, а также сферической симметричности гауссовской плотности распределения,

вероятностная мера этих множеств будет совпадать, т.е. Р(М) = Р(М1). Но множество М\М1 Ф 0 и Р(М\М1) > 0. Поэтому

Р(М) = Р(М1) + Р(М\М1) > Р(М1) = Р(М). Таким образом, Р(СГ) > Р(СГ).

Аналогичные рассуждения можно провести для произвольного числа граней / и для произвольной размерности п.

Теорема 1. Для задачи (3.7) справедливы следующие утверждения « г < Я;

(ii) существует г £ [го,Я) такое, что Р(СГ) > а и

< ^аМ < ^г < ;

(iii) если г < г2, где г1(г2 £ [го,Я) и Р(СГ1) > а, Р(СГ2) > а, то < <

Доказательство теоремы 1 .

1) Рассмотрим случай г = R и установим, что Р(СД) > а. Заметим, что по определению доверительного множества выполняется Р(5Й) = а . Поскольку согласно (3.15) , верно следующее неравенство

Р(СД) > а.

Покажем, чтого < Я. С этой целью проанализируем . Поскольку с и Ф , а мера Р - гауссова, то Р(СЙ) = а + £(а), где £(а) >0 и £(а) = Р(СЙ) — Р(5Д). Пусть - правильный многогранник, симметричный относительно нуля и содержащий , с количеством граней, равным количеству ограничений ] двойственной задачи (3.4), которое в свою очередь связано с количеством вершин

компактного выпуклого многогранника V. Согласно лемме 6 имеем P(CR) > P(CR). Поскольку вероятностная мера P гауссова, то выполняется P(CR).> P(SR) = а. Таким образом, P(CR) > а.

Пусть г определяется из условия

P(SR) = а — £г,

где

р А p(cR)-a

ьг _ 2 .

Сравним множества CR\SR и Cr\Sr. Эти множества подобны, причем

mes(Cr\Sr) > 1mes(CR\SR),

где mes - мера Лебега в Шп. Поскольку мера P гауссовская, а множество Cr\Sr находится ближе к центру осей координат, чем множество CR\SR, то выполняется неравенство

p(C J > p(cr\sr) = р(Ся)-а = „

*(^-,r\SrJ ^ 2 2 ^r'

Следовательно, для симметричного множества Cr выполняется P(Cr) = P(Sr) + P(Cr\Sr) > P(Sr) + Sr = a.

Поскольку P(Cr) > P(Cr) , то P(Cr) > а , причем г < R . Таким образом, г0 Е [p,R) существует.

Сравним и фR. Поскольку Sr с SR, т.е. Sr лежит внутри SR, при этом не касаясь его границ, а целевая функция (3.5) линейна по х, то получаем неравенство

ф (Sr,UR) < ф (Sr,Ur) = фR .

Но стратегия ur - не обязательно оптимальная для Ф^г,п). Поэтому

По доказанному выше для стратегии иГ выполняется Р(СГ) > а, т.е. верно неравенство Р^ДмГ) > а. Но по определению функции квантили

= тт{^: Р,р(иГ) > а}.

Поэтому < .

Поскольку стратегия иГ не обязательно является оптимальной стратегией для критерия ^а(м), то окончательно имеем

< РаОЛ < ^Г <

Пусть теперь г2 > г1, где г1(г2 £ [го,Я) и Р(СГ1) > а, Р(СГ2) > а. Повторяя рассуждения, проведенные выше, и заменяя г на г1 , а Я на г2 , можно получить, что^а < ^г1 < ^г2 .

Доказательство теоремы закончено.

Замечание 4. Рассмотрим более общий случай, когда случайный вектор X имеет распределение М(т, К), где К - невырожденная ковариационная матрица. Введем новый вектор

1 = К_1(х — т),

который имеет распределение N(0,1). При такой замене переменных X на 1 ограничения, задающие множество Т(и, х), преобразуются в множество Т(и, г), ограничения которого будут иметь точно такую же структуру, как и ограничения, описывающие множество Т(и, х). Таким образом, случай Х~М(т, К) сводится к случаю Х~М(0, /), рассмотренному выше.

4. Вычислительный алгоритм решения задачи

Рассмотрим вначале способ поиска точки г0. Для этого используем алгоритм дихотомии в следующей модификации. Выберем вначале точки г = р и г = R, для которых Р(Ср) < а и P(CR) > а. Рассмотрим точку г = (р + R)/2 и найдем Р(СГ), не обсуждая пока каким образом (ниже приводится алгоритм вычисления меры Р(СГ)). Если Р(СГ) >а, то далее оставляем точки р и г. Если же Р(СГ) <а, то оставляем точки г и R. И так далее производим деление пополам текущих отрезков неопределенности. Алгоритм сходится, поскольку Р(Ср) < а и P(CR) > а. Скорость сходимости этого алгоритма равна 1/2k, где k - количество делений отрезков неопределенности пополам.

Предложим теперь алгоритм вычисления Р(СГ) для произвольного г Е [p,R]. С этой целью дискретизируем меру. Пусть хк,к = 1,К, - точки, сгенерированные на основе плотности нормального распределения N(0,1) . Пусть рк = 1/К -вероятностная мера, приписанная к точке хк, к = 1,К. Таким образом, получаем меру Р, аппроксимирующую гауссову меру P. Заменим меру P на меру Р, при вычислении Р(СГ). Пусть для некоторого г Е [p,R] найдены иг и в результате решения задачи выпуклого программирования

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

фг = min^(Sr,u),ur = arg min ^(Sr, и), (4-1)

UEU UEU

где выпуклая функция Sr,u) определяется согласно (3.10). Для решения задачи (4.1) можно использовать какие-либо эффективные методы выпуклого программирования [10], например метод внутренней точки. Найдем вероятностную меру Р(СГ) множества

Cr = (х: Co^r + хтЛхиг + max aT(ur,x)v^ <

;eij

Поскольку 5rcCr, то исключим из рассмотрения точки xk £ 5r. Отметим, что вероятностная мера P(Sr) множества^ известна и вычисляется по формуле (3.13), в которой нужно заменить R на г, а а - на получаемую меру P(5r). Тогда

P(Cr) = P(Cr\5r) + P(Sr) ~ P(Cr\Sr) + P(5r).

При этом мера P(Cr\5r) может быть найдена за счет перебора лишь точек хк, лежащих вне 5r. Таким образом, вычисление вероятностной меры P(Cr) множества Cr резко упрощается.

Замечание 5. По сути, описанная процедура вычисления P(Cr) является реализацией метода Монте-Карло, из которой исключены точки, принадлежащие шару 5r.

Замечание 6. Алгоритм, подобный описанному выше, был предложен ранее в работе [8], и он был применен впоследствии для задачи из [5]. Но там ограничения, описывающие множество Т(и, х) , были линейными одновременно по и и х, а алгоритм, предложенный в данной работе, применяется для ограничений в Y(u, х), линейных отдельно по и и х (билинейных). Таким образом, алгоритм, описанный в работе [8], является частным случаем алгоритма из данной работы.

Замечание 7. Алгоритм решения задачи основан на том факте, что случайный вектор X имеет нормальное распределение (см. условия леммы 1). Следует отметить, что класс распределений случайного вектора может быть расширен, в частности, вектор случайных факторов может иметь сферически симметричное распределение.

В этом случае почти все приведенные выше рассуждения остаются верными, изменяются только размеры доверительного шара и ядра вероятностной меры.

5. Заключение

В работе рассмотрена задача управления стохастической системой по квантильному критерию для случая одной коррекции. Особенностью постановки задачи является вид функции потерь, являющейся линейной отдельно по случайным факторам и оптимизируемым стратегиям (билинейна), при этом случайные факторы имеют нормальное распределение. Используя доверительный метод, предложен алгоритм получения гарантирующего решения исходной стохастической задачи, основанный на решении задачи выпуклого программирования, которая параметризована скалярным параметром, выбираемым с помощью метода дихотомии. Основная трудоемкость предложенного алгоритма заключается в процедуре подсчета вероятностной меры многогранного множества. Однако за счет дискретизации меры нормального распределения и введения процедуры сокращения перебора точек удается сократить время счета. Библиографический список

1.Юдин Д.Б. Задачи и методы стохастического программирования. М.: Советское радио, 1979. 392 С.

2.Birge J., Louveaux F. Introduction in Stochastic programming. New York: Shpringer, 1997. С.421 .

3.Малышев В.В., Кибзун А.И. Анализ и синтез высокоточного управления летательными аппаратами. М.: Машиностроение, 1987. С. 304.

4.Кибзун А.И.,Кан Ю.С. Задачи стохастического программирования с вероятностными критериями. М.: Физматлит, 2009. С.372.

5.Кибзун А.И., Наумов A.B. Двухэтапные задачи кваитильиого линейного программирования // Автоматика и телемеханика. 1995 №1. С.83-93.

6.Наумов A.B., Бобылев И.М. О двухэтапной задаче стохастического линейного программирования с квантильным критерием и дискретным распределением вектора случайных параметров // Автоматика и телемеханика. 2012. №2. С.61-72.

7.Кибзун А.И., Наумов A.B., Норкин В.И. О сведении задачи квантильной оптимизации с дикретным распределением к задаче смешанного целочисленного программирования // Автоматика и телемеханика. 2013. №6. С.66-86.

8.Кибзун А.И., Наумов А.В. Гарантирующий алгоритм решения задачи квантильной оптимизации // Космические исследования. 1995. Том 33. № 2. С. 160-165.

9.Гольштейн Е.Г. Теория двойственности в математическом программировании и ее приложения. М.: Наука, 1971. С.351.

10. Демьянов В.Ф., Васильев Л.В. Недифференцируемая оптимизация. М.: Физматлит, 1981.С.384.

i Надоели баннеры? Вы всегда можете отключить рекламу.