Научная статья на тему 'Построение класса экстремальных стратегий управляющих дискретных систем'

Построение класса экстремальных стратегий управляющих дискретных систем Текст научной статьи по специальности «Математика»

CC BY
78
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УПРАВЛЯЮЩИЕ СИСТЕМЫ / ВЕРОЯТНОСТНЫЕ МОДЕЛИ / ПЕРЕСТАНОВОЧНЫЕ РАСПРЕДЕЛЕНИЯ / ПЕРЕСТАНОВОЧНЫЕ СТРАТЕГИИ / КВАЗИПЕРЕСТАНОВОЧНЫЕ СТРАТЕГИИ / ВЫБОРОЧНЫЕ ПРОСТРАНСТВА / МИНИМАКСНОЕ ЗНАЧЕНИЕ ФУНКЦИИ РИСКА

Аннотация научной статьи по математике, автор научной работы — Федоткин М. А.

В [1, 2] впервые предлагается статистический подход к выделению вероятностной модели (W, ℱ, P(∙)) из заданного параметрического семейства {(W, ℱ, P u (∙)): u Î U }. Выделенное вероятностное пространство (W, ℱ, P(∙)) в одних случаях будет адекватной моделью для данного статистически устойчивого эксперимента Э или управляющей системы [37]. В других случаях, когда по некоторому признаку требуется выполнить синтез управляющей системы Э, вероятностная модель (W, ℱ, P(∙)) объявляется её целевой или оптимизационной моделью. В [1, 2] для семейства {(W, ℱ, P u (∙)): u Î U } из перестановочных распределений для построения (W, ℱ, P(∙)) предлагается использовать класс перестановочных и квазиперестановочных стратегий принятия решений. В этой работе, которая является непосредственным продолжением исследований из [1, 2], изучаются свойства класса экстремальных стратегий.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

BUILDING A CLASS OF EXTREME STRATEGIES OF DISCRETE CONTROL SYSTEMS

A statistical approach to separate the probability model (W, ℱ, P(∙)) from the given parametric family {(W, ℱ, P u (∙)): u Î U } has first been proposed in [1, 2]. In some cases, the separated probability space (W, ℱ, P(∙)) will be an adequate model for the given statistically stable experiment Э or controlling system [37]. In other cases, where it is required to synthesize the controlling system Э by some criterion, the probabilistic model (W, ℱ, P(∙)) is declared to be its target or optimization model. It has been proposed in [1, 2] to use a class of permutation and quasi-permutation solution strategies for the construction of (W, ℱ, P(∙)) from the family {(W, ℱ, P u (∙)): u Î U } of permutation distributions. This work is a direct extension of studies [1, 2] and it considers the properties of a class of extreme strategies.

Текст научной работы на тему «Построение класса экстремальных стратегий управляющих дискретных систем»

Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2014, № 3 (1), с. 109-119

УДК 519.21

ПОСТРОЕНИЕ КЛАССА ЭКСТРЕМАЛЬНЫХ СТРАТЕГИЙ УПРАВЛЯЮЩИХ ДИСКРЕТНЫХ СИСТЕМ

© 2014 г. М.А. Федоткин

Нижегородский госуниверситет им. Н.И. Лобачевского

fma5@rambler.ru

Поступила в рвдакцию 18.02.2014

В [1, 2] впервые предлагается статистический подход к выделению вероятностной модели (П, P(•)) из заданного параметрического семейства {(П, P„(•)): и е и}. Выделенное вероятностное пространство (П, P(•)) в одних случаях будет адекватной моделью для данного статистически устойчивого эксперимента Э или управляющей системы [3-7]. В других случаях, когда по некоторому признаку требуется выполнить синтез управляющей системы Э, вероятностная модель (П, P(•)) объявляется её целевой или оптимизационной моделью. В [1, 2] для семейства {(П, Pи(•)): и е и} из

перестановочных распределений для построения (П, P(•)) предлагается использовать класс перестановочных и квазиперестановочных стратегий принятия решений. В этой работе, которая является непосредственным продолжением исследований из [1, 2], изучаются свойства класса экстремальных стратегий.

Ключввыв слова: управляющие системы, вероятностные модели, перестановочные распределения, перестановочные стратегии, квазиперестановочные стратегии, выборочные пространства, минимаксное значение функции риска.

Введение

Используя обозначения и выводы из [1, 2], приведем постановку проблемы и основные результаты из этих работ. Пусть при т > 2, N = ={0, 1, ...} и а е П вектор х = (хь х2, ..., хт) е е Мт является значением измерителя Е = (Ей Е2, ••, Ет) эксперимента Э, где отображение Е(а): П ^ Ыт . Если Vесть множество высказываний V относительно неизвестного параметра и е и и V = и = {1, 2, ..., т}, то отображение

V = ^(га): П ^ V определяет искомую модель

(П, Pv(•)) из семейства {(П, Ги(-)): и е и}. При заданном значении параметра и семейства

{Ри(х) = Pu({а: £(а) = х}): х е ^ } и х) =

=Pu({а: С(а) = v}|{а: £(а) = х}): V е V} определяют соответственно распределение вероятностей для £ на пространстве Мт и условное распределение для высказывания С(а) на пространстве V при фиксированном значении х е е Мт . Класс рандомизированных стратегий или решающих функций 5 = gu(v; х): и х V х Ыт ^ ^ [0, 1] обозначается через 5" и через Sc, если 5 = gu(v; х) = g(v; х). Равенства Pu({а: Е(а) = х, £(ш) = V}) = Ри(х^и^; х), и е и, х е Ыт ,

V е V, задают распределение случайного элемента (Е(а), С(ю)) на множестве Ыт х V из элементов у = (хь х2, ..., хт, V). В [1] при фиксиро-

ванных значениях и е и и 5 е 5 наряду с вектором (Е1, £,2, ..., Ет, С) на (П, Pu(•)) рассматривается случайный вектор (уь у2, ..., ут, у) на выборочном вероятностном пространстве

(Кт х V, 2"т х V, Ри, /О), где у1(у) = х1, у2(у) = х2, ., 7т(у) = =хт, у(у) = V и Ри, 4({(х, V)}) = р„(х^„^; х). Если функция потерь 1(и, V) равна нулю при и ф V и единице при и = V, то функция риска вида Н(и, 5) = Ми, ¿(1(и, у)) = Ри, ¿({у: у(у) ф и}) определяет вероятность ошибочного выбора адекватной или целевой модели из класса {(П,

Pu(•)): и е и}. Выделение из данного класса

{(П, Pu(•)): и е и} модели (П, P(•)) с помощью стратегии 5+ = gu+(v; х) е 5, которая определяется из решения функционального уравнения оптимальности тах {Р ({у: у(у) ф и}): и е и} = = тДтах{Ри>

5({у: у(у) ф и}): и е и}: 5 е 5}, и есть основная изучаемая проблема в [1, 2] и в данной работе.

Множество квазиперестановочных минимаксных стратегий

Для любого вектора х = (хь х2, ..., хт) е Ыт определим функцию р*(х1, х2, ..., хт) = = тах{ри(х\, х2, ..., хт): и е и} и множество L(x\,

x2, хт) = {и: pu(x\, x2, хт) = р (x\, x2, .

хт)}. Рассмотрим попарно непересекающиеся

множества L](x1, х2, ..., хт) = {а(/, 1), а(/, 2), ..., а(/, с(/))}, / = 1, 2, ..., е(х). Положим, что П есть множество всех взаимно однозначных отображений вида тс(/): {1, 2, ..., т} ^ {1, 2, ..., т} и для некоторого и е L/(x1, х2, ..., хт) будет также и е L(x1, х2, ..., хт). Тогда хи = Ь/, и при любом k = 1, 2, ..., с(/) в силу определения 1 из [1] имеем равенствар*(хь х2, ..., хт) = ри(х1, х2, ..., хт) = = Рл(а(/, ед(хЬ х2, ., хт) = Ра/, ^1, х2, ., хт), если только отображение е П, п(а(/, k)) = и, %(и) = а(/, k), тс(/) = I при IФ а(/, k), IФ и. Отсюда следует, что а(/, k) е L при всех k = 1, 2, ., с(/). Итак, при х = (хь х2, ..., хт) е Nm либо Lj(x1, х2, ..., хт) с L(xl, х2, ..., хт), либо имеет место соотношение Lj(xu х2, ., хт ) П L(Xl, х2, ..., хт) = = 0. С другой стороны, множество

L(x1, ^ хт) с

С

e( х)

У Lj О^ ж^..^ хт) = {l, 2m}.

= 1 - — У К(х^ Х2 , xm ^ Р* (xl, х2 , хт ).

х1 <х2 < ... <хт

Итак, для любой стационарной квазиперестановочной или все равно для стационарной перестановочной стратегии 5 = х) выполняются неравенства:

Н (5) > 1 - — У \ (х1, х2,..., хт )| Р* (х1, х2,..., хт ),

ГЦ ^^ 1 1

m

Х1< Х2 <

/=1

Поэтому

L(x1, x2, хт) = Ц'(1)( x1, x2, хт) У

У ^(2)( х1, х2, ., хт) У ... У Lj(r)( х1, х2, . , хт), (1) где {/(1), /(2), ..., /(г)} = {/■: / е {1, 2, ..., е(х)}, ^(хь х2, ., хт) с L(Xl, х2, ., хт)} и для определенности /(1) </(2) < ... </(г).

Определение 1. Любой вектор х = (х1, х2, ..., хт) е Nm назовем информативным, если р*(х1, х2, ..., хт) > 0. В противном случае вектор х = (х1, х2, ..., хт) будем называть неинформативным.

Теорема 1. Для того чтобы стационарная квазиперестановочная стратегия 5 = к(у; х) была минимаксной относительно класса 5"' [2], необходимо и достаточно, чтобы на каждом информативном векторе х = (х1, х2, ..., хт) е Nm имело место соотношение

У яО;xl, x2,хт) =1. (2)

vеL( x1, х2^ , хт )

Доказательство. Достаточность. Принимая во внимание для стационарной стратегии соотношения (8) и (15) из [2] и определение функции р*(х1, х2, ..., хт), последовательно выводим:

Н (5) = 1 - - У \\ (х1, х2,..., хт )| X т ^^

х! <х2 < ... <хт

X У с(/)рk (\,/ (х))я(k; \ / (х)) >

/=1

> 1 - — У |w(xl, хт1\ х т

х! <х2< ... <хт

е( х)

Х Р (x1, х2 , ..., хт )У с/к ^ , / (х)) =

j=1

H(s) > inf{max{P„, s({y: у(у) * u}): u e U}:

s e S' } = Ho( S' ). (3)

Напомним из [2], что величина H0( S ' ) определяет относительно класса S' минимаксное значение функции риска H(u, s).

Очевидно, что произвольная стационарная квазиперестановочная стратегия s = g(v; х1, х2, ..., хт), для которой выполняется условие (2), равна нулю при v g L(x1, х2, ..., хт) и принимает неотрицательное значение при v e L(x1, х2, ..., xm). С учетом этого, используя представление множества L(x1, х2, ..., xm) с помощью равенства (1), рассмотрим любое v e L()( х1, х2, ..., xm) = {a(j(l), 1), a(j(î), 2), ..., a(j(î), c(j(l)))} для некоторого фиксированного l = 1, 2, ..., r. Так как рассматриваемая стратегия s = g(v; х1, х2, ..., xm) является стационарной и квазиперестановочной, то для всех i = 1, 2, ..., c(j(l)) с помощью равенства Хадо), 1) = Xaji), i) = ¿да легко устанавливается соотношение

g(a(j(l), 1); xl, .Х2 xa(j(l), 1) , xa(j(l), г> xm) =

= g(a(j(l), i); Х1, Х2, Xaj(l), 1) , Xaj(l), i), Xm)= = g(a(j(l), i); Х1, Х2, ..., Xm),

если только отображение тс(-) e П, a(j(l), 1) = =%(a(j(l), i)), n(a(j(l), 1)) = a(j(l), i), %(n) = n при n Ф a(j(l), 1), n Ф a(j(l), i). Поэтому стратегия s = =g(v; x1, x2, ..., xm), которая удовлетворяет достаточным условиям теоремы, имеет следующий вид:

g(v;^x2,..., xm) =

0 при v g L(x1, x2,..., xm);

= « gK^X 1); x1, x2 , ..., Xm )

для всех v e Lj(l) (x1, x2,..., xm ),

где l = 1, 2, ..., r. Формула (4) позволяет определить стратегию s = g(v; x) для всех v = 1, 2, ..., m. В силу соотношения (8) из [2] и (4) для рассматриваемой здесь стратегии s = g(v; х) выполняется равенство

¿c(j(l))g(a(j(l), 1); .1, x2,..., Xm) = 1. (5)

l=1

Принимая во внимание равенства

Рк(Кк,j(l)(x)) = Р*(Х1, X2, Xm), k e {1,2, m}, l e {1, 2, ..., r}, соотношения (4) и (5), непосредственно из (15) работы [2] для любой ста-

(4)

ционарной и квазиперестановочной стратегии 5 = g(v; х), которая удовлетворяет условию (2), найдем:

Н (5) = 1 - -т

е( х)

(x\, x2,..., хт ) х

х1 <х2 < .. <хт

х 2 Ф) Рь (№, / (х))я (к; № и (х)) =

/=1

1 г

= 1--2 №(х1, х2,..., хт)|2Ф(0)х

х1 <х2 < ... <хт I=1

х Р* (X\, х2 , ..., хт )g (a(j(l), 1); ^ х2 , ..., хт ) =

= 1 - — 2 № (X\, х2 , ..., хт ^Р* (X\, х2 , ..., хт X

И/1 ^^ 1 1

т

Н(5) = 1 - - 2№(х\, х2,..., хт) х т ^^

х\ <х2 < ... <хт

х Р" (X\, х2 , ..., хт ) = Н 0(5> ').

= 1 - т "\ 2 №^ х2 , ..., хт ^ х

х1 <х2 < .. <хт

х 2 Ф) Рь (№, / (х))§ (к; №,; (х)) =

= 1 - т- 2 |W(X\, х2 , ..., хт )|

х 2 Ф) Рь (№, у (х))§ (к; № и (х)) -

/=\

е( х')

- т-\ |№(х\\ , x2,..., х'т )|2 С(Л х

(8)

х1 <х2 < .. <хт

Учитывая это, соотношение (3), утверждения теорем 2, 3 и 4 из [2], получим: Н(5) = тДтах{Ри,5({у: у(у) ф и}): и е и}: 5 е е 5 ' } = Н0( 5'). Поэтому любая стационарная и квазиперестановочная стратегия, которая удовлетворяет соотношению (2), является минимаксной относительно класса 5 '.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Нвобходимость. Предположим, что некоторая стационарная квазиперестановочная стратегия 5 = х) является минимаксной относительно класса 5 ', и значит,

(6)

Однако для такой стратегии всё же существует

информативный вектор X = (х\, х2,...,х'т) е Ыт ,

для которого при некотором элементе /0 из множества {1, 2, ..., е(х')} и при некотором элементе /0 из множества {1, 2, ..., с(/0)} выполняются соотношения

g(a(jo, /0); х1, х2,..., хт ) > 0,

а(/0, ?о) гL (х\,х2,...,х'т),

а(/0, /0) е Ljo(x1, x2,..., хт ) =

= {а(/0, 1), а(/0, 2), ., а(/0, с/)}. (7) Из (7) выводим, что необходимое условие (2) не выполняется. В этих обозначениях и предположениях из (15) работы [2] для стратегии 5 = g(v; х) получаем:

Н(5) = 1 - Рк, 5({у: у(у) = к}) =

х Рк (№, / (X ))§ (к № / (X)).

Так как а(/0,/0) й L (х\, х2,..., хт), то

Рк(№к,/0(х))-Р*(х[,x2,...,хт)<0. Стратегия 5 = =g(v; х) является квазиперестановочной. Поэтому выбор отображения Р(-) е П, а(/0, /0) = Р(к), Р(и) = п при п ф к и условие (7) позволяют установить, что

§ №,Л(х')) =

= §(к, х1 , х2 ,..., хк-\, х' а (/0,10), хк+\,..., хт ) = =g(a(jo, /0); x\\,x2,...,хт) > 0.

Непосредственно отсюда имеем:

Фс)Рк (№к,/0(х'))§(к;№к,/0(х')) = = (Фс) -1) Рк (№ ,/0 (X' ))§ (к; № ,/0 (X)) + + Рк (№/&))§ (к;№к,Л(х')) + +р" (х1 , x2,..., хт (к; №, Л (х)) -- Р" (х1 , X2,..., хт (к';№к/0(х)) = = { (Фо) -1)Рк (№к/ (X'))§ (к; №к,/0 (X)) + + р* (х1 , х2,..., хт )§ (к ;№к,/0 (х'))} + +{ (Рк(№(х'))-р'(х1 ,х2,...,хт))§(к;№к,Л(х')) }<

< р' (х1 , х2,..., хт М/,) § (к;№к, /0 (х')) +

+{ (Рк(№кл(х'))-р*(х1 ,х2,...,хт))§(к;№к,/0(х')) }<

< р* (х1 , х2,..., хт Мл) § (к; №к, /0 (х')). (9) Учитывая (8) и (9), для минимаксной стратегии 5 = х) относительно класса 5 ' получаем соотношение:

Н(5) = 1 -т- 2№(х\, х2,..., хт) х

х1 <х2 < .. <хт , {x1,х2,..., хт }ф ф{xi, x2,..., хт }

х 2 с(/) Рь (№к, / (х))§ (к; №к, / (х)) -

- т-1 № (х\\, х2,..., хт ) х

х 2 Ф) Р* (^к, / (х' ))§ (к , / (X)) >

х1 <х2< ... <хт , {х1,(х2,..., хт}ф ф{х1, х2,..., х'т }

> 1 - т-\ 2 № (x\, х2 , ..., Хт ) Р* (X\, х2 , ..., Хт ) -

. < хт,

хт }ф ., х'т }

- т-№ (х1, х2,..., хх ) х

х1 <х2 < ... <хт,

{х1,х2,..., хт }ф

ф(х1, х2,..., хт }

х У Ф)рк \ / (х'))к (к; \ / (х')) -

/=1, ] Ф/о

- т- \\(х', х2,..., хт )| с(/о) X

х рк (\ ,/о( Х))К (к ,/о( х')) >

> 1 - т"' У \ (xl, x2,..., хт ^ р * О^ X2,..., хт ) -

х1 <х2 < .. <хт , {х1,(х2,..., хт}Ф Ф{х1, х2,..., хт }

-т"' \\(х',х',...,хт)| Уф) х

/-1, / Ф/о

х р*(х1, x2,..., хт) к(к; \, /(х,)) -

- т- \(x1', хт )| с(/о) х X р* (х', х2,..., хт) к (к;\,/0(х')) =

= 1 - У \ (xl, х2 , ..., хт ^ р * (xl, х2 , ..., хт ) -

х1 <х2 < ... <хт , {х1,(х2,..., хт}Ф Ф{х1, х2,..., хт }

- т~' (xll, x2,..., х'т ^ р * (xll, x2,..., х'т ) х

X У Ф) к (к;\к, / (х')) =

/=1

= 1 - У \ (xl, х2 , ..., хт ^ р * (xl, х2 , ..., хт ) -

х1 <х2 < ... <хт , {х1,(х2,..., хт}Ф Ф{х1, х2,..., хт }

- т 1 (х1, хт ^ р* (х1, x;,..., хт ) =

= 1 - У \\(X1, х2 , ..., хт ^р* (X1, х2 , ..., хт X

х1 <х2< ... <хт

Итак,

Н (5) > 1 -

- ~ У \(х" х2' ...' хт )\р' (х1> х2. ..., хт ).

Т-М ^^ 1 1

т

(10)

р„ (хи х2) = 16, еслих' = х2 их', х2 е {0,1,2};

= < 14, если х' + х2 = 1;

0 для остальных значений х' и х2.

Семейство {ри(х', х2): (X', х2) е N 2} является перестановочным, так как оно не зависит от значений параметра и и выполняется условие симметрии из леммы 1 работы [1]. Легко установить, что р*(х', х2) = ри(х', х2) для всех и е {1, 2}. Поэтому L(x1, х2) = {1, 2}. Отсюда следует, что стратегия 5 = ¿(у; X', х2) = 1/2 при V е {1, 2} удовлетворяет условиям теоремы 1 и, следовательно, является минимаксной относительно класса 5'. Для этой стратегии из соотношения (6) получим, что значение функции риска Н5) = =1 - 2 (3/6 + 2x1/4) = 1/2. Рассмотрим теперь другую стационарную стратегию 5Л = X', х2):

1, если X' = х2;

ЯЛ (1; xl, х2) = 1

ял (2; xl, х2) =

0, если X' ф х2, 0, если X' = х2;

(11)

> х1 <х2 < ... <хт

Это неравенство противоречит (6), и необходимость условия (2) доказана от противного. Утверждение теоремы 1 установлено.

Множество стационарных минимаксных стратегий

Теорема 1 описывает подмножество минимаксных стратегий относительно класса 5', которые являются элементами из множества всех стационарных и квазиперестановочных стратегий. Однако существуют минимаксные стационарные стратегии относительно класса 5', которые не являются квазиперестановочными. Для установления этого факта рассмотрим простой пример. Пусть при каждом заданном значении параметра и е и = {1, 2} семейство {ри(хь х2): (X', х2) е N 2} распределений для вектора (£,', ^2) определяется равенством вида

1, если X' Ф х2.

Для отображения %(1) = 2 и % (2) = 1 имеем: ЯЛ(%(1),0,0) Ф кл(1;0,0). Поэтому стратегия 5Л = = ял (V; X', х2) не является квазиперестановочной. С другой стороны,

Н(и, 5Л) = 1 - Ри,5л ({у: у(у) = и}) =

= У рИ(хь х2)ял(и; X', х2).

(х1, x2)еN 2

Тогда из (10) и (11) получаем, что Н(1, 5Л) =

= У ри(х', х2) = 1/2 и Н(2, 5Л) = У ри(х', х2) =

X' = х2 X' Ф х2

=1/2. Значит, Н(5Л) = тах{Н(и, 5Л): и = 1, 2}= =1/2, и на основании теоремы 4 из [2] стратегия 5Л = X', х2) является минимаксной относительно класса 5'. Итак, показано существование стационарной минимаксной стратегии относительно класса 5', которая не является квазиперестановочной. В связи с этим установим фундаментальное свойство такого рода минимаксных стратегий.

Теорема 2. Если стационарная стратегия 5 = ё(у; х) является минимаксной относительно класса 5', то на любом информативном векторе х = (X', х2, ..., хт) е Nm имеет место (2).

Доказательство. По теореме 4 из [2] существует такая не зависящая от значения и неизвестного параметра квазиперестановочная стратегия

и

№ = х) =

т

= (т!)-'У У К(к; ха(1), Xа(2),..., ха( т)) , (12)

к=1 а(г) еП (к ,у)

для которой Н(5) > Н(50). Так как стратегия 5 = к(у; х) является минимаксной относительно класса 5', то стратегия 5|(0'1 = к(0)(у; х) также будет минимаксной относительно класса 5'. Для

стационарной, квазиперестановочной и мини-

(0) (0)

максной стратегии 5 = к (V; х) относительно класса 5' по теореме 1 выполняются равенства 5(0) = К(0)(у; X', х2, ., хт) = 0, V Й L(Xl, х2, ., хт), на каждом информативном векторе х = (X', х2, ..., хт) е Nm . Используя теперь равенство (12), легко найдем:

0 = У К(0)(у; ^ х2 , хт ) =

x1, x2,., хт )

= У (т!)-1 х

УЙН x1, x2,..., хт )

' У У к (к; ха(1), ха(2),..., ха(т)) = У (т!)1 X

к=1 а(1) е П(к,у)

уШ, x1, x2,..., хт)

У У к (к; ха(1), ха(2),..., ха(т)) +

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

к=1,к фу а(1) еП (к ,у)

У (т!)-' У К(к;ха(1), ха(2), ..., ха(т) ) >

уйДX',х2,...,хт) а(/) е П(у,у)

> (т! )-1 У Я (у; X', х2,..., хт) > 0.

xl, x2,..., хт )

Непосредственно отсюда легко получаем, что

У К(у; x1, х2 , ..., хт ) = 0

и

(13)

уИ( x1, x2,..., хт )

У ё (у; X1, х2 , ..., хт ) = 1

уеИ x1, x2,..., хт )

так как У к (у; X', х2,..., хт) = 1. Значит, усло-

V = 1

вие (2) выполняется, и это условие одновременно является необходимым.

Экстремальные стратегии и их свойства

В этом разделе рассмотрим два типа специальных стационарных стратегий. Особый интерес к этим стратегиям объясняется рядом причин. Во-первых, такого рода стратегии часто используют при решении практических задач. Во-вторых, эти стратегии очень просты в вычислительном отношении. В-третьих, они являются минимаксными для целого класса

{р„(хьх2, ..., хт): (X', х2, ..., хт) е ^ } распределений вектора (£,', ..., £,т). Наконец, эти стратегии обладают свойством адаптивности к изменениям распределения {ри(х', х2, ..., хт): (х', х2, ..., хт) е Nm }. Первый тип стратегии будем обозначать через 57 = к'(у; X', х2, ..., хт), её конструкция учитывает экстремальные свойства распределения вектора (£,', ..., £,т).

Лемма 1. Пусть стратегия 57 = к'(у; X', х2, ..., хт) задается равенством

К ' (у; xl, х2 , ..., хт ) =

0 при Vй ¿(X', х2,..., хт);

= < ^О^ х^..^ хт )|-'

для всех V е ¿(X', х2,..., хт),

где ¿(X', х2, ..., хт)| есть число элементов множества ¿(х', х2, ..., хт). Тогда стационарная стра-

V V, \

тегия 5 = к (у; X', х2, ..., хт), которая определяется формулой (13), является квазиперестановочной и минимаксной относительно класса 5'.

Доказательство. Для любого отображения %(•) е П выполняются равенства р*(х', х2, ..., хт) = = тах{р„(х' , х2, ., хт) : и е и} = тах{р%(„)(х1, х2, ., хт): и е и}. Так какр*(х%(1), х%(2), ., х%(т)) = = тах{р„(х%('), х%(2), ..., х%(т)): и е и} и имеет место соотношение р%(и)(х', х2, ..., хт) = = Рu(x%(1), x%(2), то р (X', х2, ., хт) =

= р*(х%(1), х%(2), ..., х%(т)). Пусть ¿(х%('), х%(2), ...,

х%(т)) = {и: ри

(х%(1), х%(2), ..., х%(т)) = р (х%(1), х%(2), ..., х%(т)), и е и} = {и', и2, ..., uí} с {1, 2, ..., т}, тогда ¿(X', х2, ..., хт) = {и: ри(х', х2, ..., хт)= = р*(х', х2, ..., хт), и е и} = {%(и'), %(и2), ..., %(щ)}. Действительно, если и е {и', и2, ..., и},

то Рu(x%(1), x%(2), х%(т)) = р (x%(1), x%(2), х%(т))

илир%(и)(х', х2, ., хт) = Р*(х', х2, ., хт), т.е. %(и) е е {%(и'), %(и2), ..., %(щ)}. Наоборот, если %(и) е е{%(и'), %(и2), ..., %(щ)}, то Р%(и)(хЬ х2, ..., хт) = = Р*(х1, х2, ..., хт) или Ри(х%(1), х%(2), ..., х%(т)) = = Р*(х%(1), х%(2), ..., х%(т)), т.е. и е {и', и2, ..., щ}. Следовательно, |L(xl, х2, ..., хт)| = ¿(х%(1), х%(2), ., х%(т))| = t. Из формулы (13) получим:

К17 (у; xl, х2 , ..., хт ) =

[0 при V й {%(щ), %(и2),..., %(щ)}; "' для всех V е {%(щ), %(и2),..., %(щ)},

К (У; х%(1), х%(2) , ..., х%(т) ) =

[0 приVй{Щ',и2,...,и1};

[t4 для всехVе{и',и2,...,и1}.

Из (14) при V = %(и) е {%(и'), %(и2), ., %(ut)} получаем к7(%(и); X', х2, ., хт) = Г1, а из (15) при V = и е {и', и2, ..., ut} находим ¿'(и; хпо, х%(2), ., х%(т)) = Г1. Сравнивая эти резуль-

(14)

(15)

х

+

таты, выводим, что §У(л(и); х\, х2, ..., хт) = ¿'(и; хп(\), хл(2), ..., хп(т)) = Г при и е {и\, и2, ..., и}. Аналогично показываем, что §'(л(и); х\, х2, ..., хт) = §'(и; хп(\), хл(2), ., хл(т)) при и £ {и\, и2, ., и}. Итак, стационарная стратегия 5У = gV(v; х\, х2, ., хт) является квазиперестановочной. Из (13) следует, что для этой стратегии имеет место соотношение (2). Отсюда по теореме 1 экс-

v v, \

тремальная стратегия 5 = § (V; х\, х2, ..., хт) будет минимаксной относительно класса 5 '. Лемма 1 доказана.

Изучим теперь свойства второго типа экстремальной стационарной стратегии, которую ниже будем обозначать через 5У = х\, х2, ..., хт). Алгоритм построения этой стратегии основан на экстремальных свойствах числовых значений х\, х2, ..., хт измерителей Е\, Е2, ., Ех. Пусть множество Lv(x\, х2, ..., хт) = {к: хк = = тах{х\, х2, ..., хт}, к = 1, 2, ..., т} для любого вектора х = (х\, х2, ., хт) е Ыт .

Теорема 3. Для того чтобы стационарная стратегия

§ V (V; x\, x2,..., хт) =

§ С^; хл(\), хл(2),..., хл(х)) =

0 приVгЦ,v2,...,vr}, г-1 для всех Vе v2,...,vr};

§ v (v; ^ x2,..., хт) =

(18)

(16)

0 при V г V (х\, х2,..., хт),

= <\Г (x\, x2,..., хт )|-1

для всех V е V(х\, х2,..., хт)

была минимаксной относительно класса 5 ', необходимо и достаточно, чтобы для каждого вектора х = (х\, х2,...,хт) е Ыт выполнялось соотношение

Lv(x\ , х2, ., хт) С 2(х\, х2, ..., хт). (17) Доказательство. Нвобходимость. Сначала найдем множества 1?(х\, х2, ..., хт) и 2^хл(\), хп(2), ..., хл(т)) для любого фиксированного отображения •л:(-) е П. Пусть величина xv = = тах{х\, х2, ..., хт}. Из определения отображения тс(-) следует, что тах{хЛ(\), хП(2), ..., хл(т) } =тах{х\, х2,...,хт}. Поэтому xv = тах{хЛ(\), хП(2), ..., хп(т)}. Если теперь 2^хл(\), хп(2), ..., хп(т)) = = {V: хпМ = Xv, V = 1, 2, ..., т} = {v\, V2, ..., Vг} с с{1, 2, ..., т}, то Lv(x\, х2, ..., хт) = {V: х^, = xv, V = 1, 2, ..., х} = {тс(у\), тс(у2), ..., тс(^)}. В самом деле, если V е е 2^хЛ(\), хП(2), ., хП(т)),

то хП(„) = xv, и поэтому е Lv(x\, х2, ..., хт) = {тс(у\), тс(^), ..., тс(уг)}. Иначе, если тс^) е ТС^), ..., = = LV(X\, х2, ..., хт), то

v Т V/

х^) = х , и в силу определения V (хП(\), хП(2), ..., хП(т)) получаем, что V е еLV(xЛ(\), хП(2), ., хП(т)) = {v\, v2, ..., vг}. Суммируя все эти результаты, выводим, что \[?(х\, х2, ..., хт)\ = ^(х^), хп(2), ..., хП(т))\ = г. Принимая теперь во внимание определение стратегии 5V с помощью равенства (16), найдем, что

[0 приVё{я(>\),я(>2),...,)}, (19)

[г - для всех V е ), ),..., )}.

Из (18) при V = и е v2, ..., vг} имеем хП(\), хЛ(2), ., хП(т)) = г-1, а из (19) при V = %(и) е е{тс^\), тс^), ..., получаем gv(тс(u); х\, х2,

..., хт) = Г1. Отсюда выводим, что х\, х2,

.••, хт) = ¿'(и; хЛ(\), хП(2), ..., хП(т)) = г- при и е е{v\, v2, ..., V,}. Совершенно так же установим следующее равенство: gv(л(u); х\, х2, ..., хт) = = gv(u; хП(\), хП(2), ., хП(т)) = 0 при и г {V\, V2, ., vг}. Следовательно, стационарная стратегия 5V = =gV(v; х\, х2, ..., хт) является квазиперестановочной.

Для завершения доказательства этой части теоремы предположим сначала, что вектор х = (х\, х2, ..., хт) является существенным. Тогда для квазиперестановочной и минимаксной стра-

v v/ \

тегии 5 = § (V; х\, х2, ..., хт) относительно класса 5 1, которая является стационарной, по теореме 1 выполняется равенство (2). Используя это и (16), легко найдём:

2яv(у;^ х^• хт) =

x1, x2,•, хт )

2яv(v;x\, x2,хт) =

( хЬ х2^ , хт )

Предположим теперь, что существует v0 е

еLV(x\, х2, ..., хт) и v0 г Lv(x\, х2, ..., хт). Так как стратегия 5V = х\, х2, ..., хт) = г- > 0 при

V е LV(X\, х2, ..., хт), то gV(Vo; х\, х2, ..., хт) > 0. Поэтому получаем противоречие

2§(v; ^ x2, хт) +

УеД x1, x2,•, хт )

+ gV(vo; х\,х2, ...,хт) > 1. Значит, необходимое условие (17) выполняется, если вектор х = (х\,х2, ., хт) является сущест-венн^1м. Остаётся допустить, что вектор х = (х\, х2, ., хт) будет несущественным. Отсюда множество 2(х\, х2, ., хт) = {1, 2, ., х}, и соотношение Lv(x\, х2, ., хт) с 2(х\, х2, ., хт) ={1, 2, ., т}, естественно, имеет место.

Достаточность. Для стационарной квазиперестановочной стратегии 5V = gV(v; х\, х2, ., хт) справедливо равенство

2яv(v; ^ x2, хт) =

vеLV ( x1, х2^ , хт )

Теперь из соотношения (17) получаем, что 2Яv(V; х\, х2, хт) = 1. Поэтому по тео-

Уе2( x1, X2,•.-, хт )

реме 1 стратегия 5 = к (у; X', х2, ..., хт) будет минимаксной относительно класса 5'. Теорема 3 установлена.

Приведем несколько примеров, в которых условие (17) имеет место, и также рассмотрим пример, когда условие (17) не выполняется.

Пример 1. Пусть числа X > 0 и ц > 0 определяют распределение w(n) = е-ХХп/п! на N и рас-

ц х1 + х2 + .+ хт

пределение р(х', х2, ..., хт) = -е~тц

х'!х х2!х ... х хт!

на Nт. Если произвольное отображение %(•) е еП, то компоненты вектора (х%о, х%(2), ..., х%(т)) получаются путем перестановки компонент вектора (X', х2, ..., хт). Поэтому х%о + х%(2) + ... + +х%(т) = X' + х2 + ... + хт, (х%('))! X (х%(2))! X ... X х (х%(т))! = (X')! X (х2)! X. X хт! и р(х%('), х%(2),

х%т+х%г?1)+...+х%|

. • х%(т))

Ц

(х%(1) )! х (х%(2) )! х "-х (х%( т))!

х2, ..., хт), и, значит, распределение {р(х', х2, ..., хт): (X', х2, ..., хт) е Nm } будет симметричным. Тогда на основании содержания и доказательства леммы 1 из [1] выводим, что распределение

ри(х1, х2, ., хт) =

хи

= У ™(х')Р(^ х2 , ..., X - х', ..., хт ) =

= е

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

т х^ -(Х+тц )ТТ _Ц_

П 4т У^ц-1) х'тх

(х„)!

(X)!(хи - X)!

х а

(хи +1)(1 - а)т+' ах' ++х2 + + хт при а = Ь,

(1 - Ь)(1 - а)та

т X' ++х2 + ...+х^

1 - (Ь / а)хи+ 1 - (Ь / а)

(20)

-е-тц =р(х',

при а Ф Ь

будет перестановочным. Из (20) следует, что Ь~Хх', х2, ..., хт) = ¿(X', х2, ..., хт). Итак, стратегия 5У = к (у; X', х2, ..., хт) для этой задачи будет также минимаксной относительно класса 5 .

Пример 3. Пусть целое число с > 0 определяет распределение w(n) на N которое равно единице при п = с и нулю при п Ф с. Пусть w2 = ^2(п):п е N} - некоторое распределение на N W2(n)>0 при всех nеN, и функция w2(г - с)/ w2(г) при г > с монотонно не убывает по г. Симметричное распределение р(х', х2, ..., хт) на Nт в этом примере будем задавать соотношением р(хь х2, ..., хт) = w2(x1) х w2(x2) х

хи

X...XW2(Xm). Если ри(х', х2, ..., хт) = У w(X ') x

х =0

х р( xl, х2, ..., хи - х', ..., Хт), то

0 при хи < с, Щ(хи - с)

Ри С^ x2, хт ) =<

П W2(xí) (21)

= (1 + (Хц-1))х"е-(Х+тц) П—,

и х,!

(X', х2, ..., хт) е Nm,

для вектора (£,', ..., £,т) является перестановочным. Более того, из окончательной формулы для ри(х', х2, ..., хт) непосредственно получаем, что для любого вектора (X', х2, ..., хт)е Nm множество {и: хи = тах{х', х2, ..., хт}, и = 1, 2, ..., т} = {и: Ри(х', х2, ..., хт) = Р*(хЬ х2, ..., хт)}, т.е. ¿(X', х2, ..., хт) = ¿^(х', х2, ..., хт). Поэтому

v v/ \ ~

стратегия 5 = к (у; X', х2, ..., хт) для этой задачи будет минимаксной относительно класса 5 . Пример 2. Пусть р(хь х2, ..., хт) = (1 - а)т х

+хт , (X', х2, ..., хт) е Nт, 0 < а < 1, и w(n) = (1 - Ь)Ьп, п е N, 0 < Ь < 1, задают распределение на Nт и, соответственно, на N. Используя метод, который был предложен для решения вопросов примера 1, легко показать, что распределение

ри(х1, х2, ., хт) =

хи

= У ™(х')Р(^ х2 , ..., X - х', ..., хт ) =

х' = 0

^(хи ) ,=1

При х„ > с.

По лемме 1 из [1] распределение (21) будет перестановочным. Легко видеть, что при тах{х', х2, ., хт} < с будетРи(х', х2, ., хт) = 0 для каждого и е и. Поэтому имеем ¿(X', х2, ..., хт) = {1, 2, ..., т}, LV(x1, х2, ..., хт) с ¿(X', х2, ..., хт). Так как функция w2 (г - с) / w2 (г) при г > с монотонно не убывает по 2 и тах{х', х2, ..., хт} > с, то непосредственно из (21) снова имеем ¿^х', х2, ..., хт) с ¿(X', х2, ..., хт). Для этой задачи по теореме 3 стратегия 5V = к (у; X', х2, ., хт) будет опять минимаксной относительно класса 5 .

Рассмотрим теперь простой пример, когда соотношение (17) не имеет места.

Пример 4. Пусть т = 2, а распределение ^(п): п е N1 на N и распределение {р(хь х2): (X', х2) е N 2} на N 2 удовлетворяют ограничениям w(1) > 0, р(1, 0) = р(1, 1) = 0, р(0, 2) > 0. Тогда в соответствии с условиями и формулами леммы 1 из [1] легко найдем, что х1

Р' (X', х2) = У w(х')р(X' - х 1, х2), X=0

х2

р2 (X', х2) = У w(x1)р(X', х2 - х'), X=0

Р\ (х\, х2) = 2 X)р(х\ - X 1, х2),

X=0

х2

р2 (х\, х2) = 2 н(х1)р(х\, х2 - X).

х'=0

Отсюда с учётом принятых ограничений непосредственно получим, что

Р\(1, 2) = Н(0)р(1, 2) + Н(1)р(0, 2), Р2(1, 2) = н(0)р(1, 2) + н(1)р(1, 1) + +н(2)р(1, 0) = н(0)р(1, 2), р\(1, 2) > р2(1, 2). Поэтому, принимая во внимание определение множеств х2) и 2(х\, х2), выводим, что

Lv(1, 2) = {2} и 2(1, 2) = {1}. Следовательно, соотношение (17) не выполняется. Поэтому экстремальная стратегия вида 5V = gV(v; х\, х2) для этого примера может не быть минимаксной относительно класса 5'.

Стандартные семейства вероятностных моделей

Рассмотрим теперь стандартные семейства вероятностных моделей управляющих систем, которые представляют практический интерес.

п

Теорема 4. Пусть функция 2 Н X) х

X=0

х н2(п - X)н2(п)-\ монотонно не убывает по

п е N, где {м>(п): п е N1 и {н2(п): п е N1 - некоторые распределения на N и н2(п) > 0 для любого п е N. Тогда при каждом фиксированном и е и множество вида {ри(х\, х2, ..., хт): (х\, х2, ..., хт) е Nm }, где

Ри(x\,х2,...,хт ) =

\ хи Х (22)

= (н2 (хи )) 2 х') н2 (X - х 1 )П н2 (хк ),

X=0 к=\

является перестановочным распределением для вектора (Е\, Е2, ..., Ех), и стратегия 5V = gV(v; х\, х2, ., хт) будет минимаксной относительно класса 5'.

Доказательство. Из формулы (22) для ри(х\, х2, ..., хт) выводим, что функцияРи(х\, х2, ., хт) > > 0, и, кроме того, выполняются следующие равенства:

2 Ри (X\, х^.- хт ) =

(х\,х2,...,хт

2 (Н2(х„ ))-12^(х')>

(x1,x2,...,хт )еN'

х

Н2(X - х)П хк ) = 1 к=\ Л Л

и е и является распределением для вектора (Е\, Е 2, ., Е т). Из соотношения (22) при любом отображении •л:(-) е П получаем, что

рж(и) (х\, х2 , ..., хх) =

х%(и) т (23)

= 2 Н(х 1 )Н2 (хп(и) - х')П н2 (хк ) / н2 (хл(„) ),

х'=0 к=\

Ри (хл(\), хя(2), ..., хл( х)) = х*(и) т (24)

= 2 Н(х 1 К (хя(щ) - х)П Н2 (хк ) / н2 (х,(И) ).

х'=0 к=\

Из равенств (23) и (24) получаем, что Рж(и)( X\, х2 , ..., хх ) = Ри (XЛ(\), х^(2), ..., хл(х)) для каждого отображения е П. Итак, соотношение (22) определяет перестановочное распределение для вектора (Е\, Е2, . ••, Ех). Затем, так

п

как функция 2 н(п)н2(п - х ')/ н2(п) монотон-

X=0

но не убывает по п е N, то из (22) для любого (х\, х2, ..., хт) е Nm множество Lv(x\, х2, ..., хт) = = {V: хг, = тах{х\, х2, ..., хт}, V = 1, 2, ..., т} с с 2(х\, х2, ..., хт). По теореме 3 стратегия 5V = =gV(v; х\, х2, ..., хт) будет минимаксной относительно класса 5'. Утверждение теоремы 4 доказано.

Теорема 5. Пусть при любом фиксированном и е и выполняются равенства

Ри5- ({У: у\( У) = х\'

у 2 (У) = х2,..., у т (У) = хт , у( У) = v}) =

= ]2н(х')н2(хщ - х)П н2(хк) х (25)

X=0 к Фи

х gJ(v■; х\, х2, ..., хт), V е V, (х\, х2, ..., хт)е Nm , где {м>(п): п е N1 и {н2(п): п е N1 - некоторые распределения на N. Тогда случайные величины у\(у), у2(у), ..., ух(у) независимы на выборочном вероятностном пространстве (Nm х V, 2N х г, Р „ (•)), и экстремальная функция риска

да да

Н(5> 1 - 2 Н(х) 2 Н2(п - х) >

X=0 п=х'

ск

х2 ТГ Нк (п)?\Х-1-к (п -1), (26)

к =0 к + 1

где #\(-1) = 0 и q\(n) = q\(n -1) + н2(п) для всех п е N. В случае если н2(п) > 0 для любого п е N, то

Н(5> 1 - 1 2 Н(х') 2

н2 (п - х')

и = 1, 2, ..., т. Следовательно, семейство {ри(х\, х2, ..., хт): (х\, х2, ..., хт) е Nm } при каждом фиксированном

т х=0 п=х 1 н2(п) х [^т (п) - чС (п -1)]. (27)

Доказательство. Из равенства (25) получим, что для всех / Ф и имеет место:

Р V({у: 1,(у) = х1}) = Из определения стратегии 5 = к (у; X', х2, ...,

г хт) по формуле (16) и соотношений (31) найдём

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= У У Уw(x')w2(ги - х') х вероятность

(Г',Г2,..., 1Я)е^, г,. = х,. У" х " (28) Ри,^ (Аи П ви) = Ри,^ ({У: у(у) = И тю^'СуХ

хП w2(zk) к v (V, г1г г2,..., г ) = w2(x.), ъСуХ 1т(у)} Ф 1и(у)}) = 0.

кФИ т Отсюда Р V ({у: 1(у) = и}) = Р V (Аи П Ви). По-

({у : У'( у) = х1, ЪОО = х2,..., 1т (у) = хт}) = этому ^ ^

= У У w(X)w2 (х„ - х ') X Н(5) = 1 - Р,IV ({у: 1(у) = и})=

= 1 - Ри,^ (Ви П Аи). (32)

События вида Ви;0, Ви; ¿о, ,(2), ..., ,(к), где 1 < к <

= Ум^Схи-х')Пw2(xk), (29) - ,(1) е и, ,(2) е и, .■; ¿(к) е и, ф и,

х'=0 к фи ¿(2) ф и, ..., ¿(к) ф и и ¿(1) < ¿(2) < ...< ¿(к), обра-

Р V ({у: 1 и (у) = хи}) = зуют разбиение события Ви. Тогда " " (Ви П Аы) = (В„;0 П Аы) и

"2\ ли у=1 х'=0

ХП w2(xk )К (v, ^ х2 , ..., хт ) =

к Фи

т ги \ и 11 И

я-1 Л

У У уу w(x')w2 (г„- х,) х

(21,22 2я )еNm , % = хщ " 1 х 0 и

X

П ^к )К 2р г2 , ..., 2Я ) =

и и (Вщ; 1 (1), ¿(2),..., /( к) П Аи)

у к=1 /(1)<¿(2)<... < /(к) у

2 к 1 2 т

к фи Учитывая теперь теоремы сложения, умноже-

ния и формулу (16), получим

Р V (Ви П Ащ) = Р V (В„;0) +

= У м>(х,)щ(хщ - х,). (30)

И, 5

я-1

Учитывая (29), (28) и (30), получаем соотноше- Я-1 '

ние следующего вида: + У У Р^ (Вщ;!,'),¿(2),...,¿(к)). (33)

Ри у ({ у : 1'( У) = X', 12 ( У) = х2,..., 1 я ( У) = хт }) = к=' к +1 /(1) < /(2) <..< /(к)

х Принимая во внимание соотношения (28), (29) и

= У w(x')W2(xи - х )ПW2(хк) (30) и определение всех событий вида ВЩ0, Вщ

х'=0 к Фи

на ( л хлттр а ( \ 'О- - г(k), найдем:

= РИ^ ({у: 1 и (у) = хи })ПР^({у: 1 ,(у) = X-}). » п

Ъ ' ¿Фи ' „ Р V(В 0) = У У w(X)w,(n -х')а1т-1(п-1)

Отсюда выводим, что случайные величины ; 4/24

1'(у), 12(у), ..., 1Я(у) независимы на выборочном

/■ лтЯ 1Г r\Nm х К

вероятностном пространстве (N х К, 2 ,

Ри,^ (О). = У У 4х 1 ^(п - х)w2к (п)дГ-1-к (п -1),

Перейдём к доказательству равенства (26). Рассмотрим события из 2N х К :

п=0 х '=0

р, „v (ви;/(1),¿(2)...../(к)) =

и;/(1), ¿(2),..., /( к V

к т-1-к

п=0 х'=0

1 < к < я - 2,

Аи = {у: 1(у) = и}, Вщ = {у: тах{1'(у), 12(у), ..., (Вщ;/(1),1 (2),..,/(т-1))

и

ЪгШ = ^(уЖ

Вщ = (X X К) \ Ви, (31)

Ви; 0 = {у: 1и(у) > 1,(у), 1 < / < Я, / Ф и}, Ви; ,(1) = {у: 1и(у) = 1,(1)(у) > 1,(у) ,

И,5

« п

= У У 4х ')w2(n - х)w2Я-'(п).

п=0 х'=0

Используя эти равенства в соотношении (33),

получим, что

/ е и \ {и, ¿(1)}}, ¿(1) е и, ¿(1) Ф и ..., т-1 ск » п

Ви; /('), /(2),...,,(к) = {у: 1и(у) = 1,(')(у) = 1,(2)(у) = Рщ^(Вщ П Ащ) = У-я-1У У w(x')х

=. = 1,(к)(у) > 1,(у) , , к=0 к + 'п=0 х=0 (34)

/ е и \ {и, ¿(1), ¿(2), ., /(к)}}, 1 < к < т - 2, х w2(n - X)w2к(п)^'Я-1-к(п -1).

¿(1) е и, ¿(2) е и, ..., /(к) е и, ¿(1) ф и, ¿(2) ф и, ..., /(к) ф и, ¿(1) < ¿(2) < ...< /(к),

Ви; ,(1), ,(2), ,(т - 1) = {у: 1и(у) = 1,(1)^) = 1,(2)(у) =

Учитывая равенство (34) в соотношении (32) и меняя порядок суммирования по п и по х', установим равенство (26).

Наконец, покажем равенство (27), если до-

. • • ^ 1 ,(т 1) (y)}, полнительно w2(n) > 0 для п е N.

¿(1) е и\ {и}, ¿(2) е и \ {и}, ..., /(т - 1) е еи \ {и}, /(1) < ¿(2) < ..< /(я - 1).

Действительно, выполним при w2(n) > 0, п е N, следующие преобразования:

а

У^-W2k (n)q m-1-k (n _ 1) = Tik +1

k-0 k + 1 m_1 çk+1

^ " -wk

-УТ^Лk (n)q1m_'_k (n _ 1)

mj-0 k +1

m

1 »

_ - y

111 VI— /ч

y cm (_1)kb(n+1)k _y cm (_1)kb

k=0 k=0 i » m

= 1 _—b-cyy cm(_1)kbnk(bk _ 1) =

rn n=c k=0

i да m

= 1 _—b-c yy cm (_1)kbnk (bk _ 1) =

i m да

= 1 _—b-c y cm (_1)k (bk _ 1)y bnk =

mm

m

=1—bc y cm (_1)k (bk _ 1)-m ti 1

bc

1 х

= 2 О/ (п)?Гк (п -1) =

= Ч\х (п) - Ч\х (п -1) хн2 (п)

Подставляя это выражение в (26), получим (27). Теорема 5 доказана.

Формулы (26) и (27) для вычисления экстремальной функции риска являются достаточно общими и, естественно, громоздкими. Однако в конкретных случаях, которые представляют практический интерес, выражение для Н(5/) можно значительно упростить. Проиллюстрируем это на примере.

Пример 5. Пусть с есть некоторое целое неотрицательное число и 0 < Ь < 1. Пусть также м>(п) равно единице при п = с и нулю при п Ф с, а н2(п) = (1- Ь)Ьп. Отсюда легко находим, что

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

п

q\(n) = 2 (1 - Ь)Ьх = 1 - Ьп+\ . Принимая это во

X=0

внимание, из (27) последовательно найдём:

1 да

Н^) = 1--ь-с 2[(1 - ьп+\)х - (1 - Ьп)х] = 1-

И/1

1 I m

= 1 +— b _ I y ck (_1)kbck +1 _ 1 m Itf

= 1 _ — b-c [1 _ (1 _ bc )m ]. m

_ bk

\

(35)

Список литературы

1. Федоткин М.А. Задача оптимизации для перестановочного семейства вероятностных моделей систем с управлением // Вестник Нижегородского университета им. Н.И. Лобачевского. 2012. № 5(2). С. 222-227.

2. Федоткин М.А. Свойства перестановочных и квазиперестановочных стратегий управляющих дискретных систем // Вестник Нижегородского университета им. Н.И. Лобачевского. 2014. № 2 (1). С. 191-198.

3. Zorine A.V., Fedotkin M.A. Optimization of Control of Doubly Stochastic Nonordinary Flows in TimeSharing Systems // Automation and Remote Control. 2005. V. 66. № 7. P. 1115-1124.

4. Пройдакова Е.В., Федоткин М.А. Управление выходными потоками в системе с циклическим обслуживанием и переналадками // Автоматика и телемеханика. РАН. 2008. № 6. С. 96-106.

5. Федоткин М.А., Федоткин А.М. Анализ и оптимизация выходных процессов при циклическом управлении конфликтными транспортными потоками Гнеденко-Коваленко // Автоматика и телемеханика. РАН. 2009. № 12. С. 92-108.

6. Fedotkin M.A. Construction and analysis of probability models for controlled evolutionary systems // Theory of Probability and Mathematical Statistics. 2012. V. 85. P. 133-147.

7. Федоткин М.А. Модели в теории вероятностей. М.: Наука-Физматлит, 2012. 608 с.

BUILDING A CLASS OF EXTREME STRATEGIES OF DISCRETE CONTROL SYSTEMS

M.A. Fedotkin

A statistical approach to separate the probability model (Q, if, PQ) from the given parametric family {(Q, if, Pu(0): u e U} has first been proposed in [1, 2]. In some cases, the separated probability space (Q, if, PQ) will be an adequate model for the given statistically stable experiment Э or controlling system [3-7]. In other cases, where it is required to

synthesize the controlling system Э by some criterion, the probabilistic model (Q, if, PQ) is declared to be its target or optimization model. It has been proposed in [1, 2] to use a class of permutation and quasi-permutation solution strategies

for the construction of (Q, if, PQ) from the family {(Q, if, PuQ): u e U} of permutation distributions. This work is a direct extension of studies [1, 2] and it considers the properties of a class of extreme strategies.

Keywords: control systems, probabilistic models, permutation distributions, permutation strategies, quasi-permutation strategies, sample spaces, minimax value of the risk function.

References

1. Fedotkin M.A. Zadacha optimizacii dlya perestano-vochnogo semejstva veroyatnostnyh modelej sistem s upravleniem // Vestnik Nizhegorodskogo universiteta im. N.I. Lobachevskogo. 2012. № 5(2). S. 222-227.

2. Fedotkin M.A. Svojstva perestanovochnyh i kvazi-perestanovochnyh strategij upravlyayushchih diskretnyh sistem // Vestnik Nizhegorodskogo universiteta im. N.I. Lobachevskogo. 2014. № 2 (1). S. 191-198.

3. Zorine A.V., Fedotkin M.A. Optimization of Control of Doubly Stochastic Nonordinary Flows in TimeSharing Systems // Automation and Remote Control. 2005. V. 66. № 7. P. 1115-1124.

4. Projdakova E.V., Fedotkin M.A. Upravlenie vyhod-nymi potokami v sisteme s ciklicheskim obsluzhivaniem i perenaladkami // Avtomatika i telemekhanika. RAN. 2008. № 6. S. 96-106.

5. Fedotkin M.A., Fedotkin A.M. Analiz i op-timizaciya vyhodnyh processov pri ciklicheskom uprav-lenii konfliktnymi transportnymi potokami Gnedenko-Kovalenko // Avtomatika i telemekhanika. RAN. 2009. № 12. S. 92-108.

6. Fedotkin M.A. Construction and analysis of probability models for controlled evolutionary systems // Theory of Probability and Mathematical Statistics. 2012. V. 85. P. 133-147.

7. Fedotkin M.A. Modeli v teorii veroyatnostej. M.: Nauka-Fizmatlit, 2012. 608 s.

i Надоели баннеры? Вы всегда можете отключить рекламу.