Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2014, № 3 (1), с. 109-119
УДК 519.21
ПОСТРОЕНИЕ КЛАССА ЭКСТРЕМАЛЬНЫХ СТРАТЕГИЙ УПРАВЛЯЮЩИХ ДИСКРЕТНЫХ СИСТЕМ
© 2014 г. М.А. Федоткин
Нижегородский госуниверситет им. Н.И. Лобачевского
Поступила в рвдакцию 18.02.2014
В [1, 2] впервые предлагается статистический подход к выделению вероятностной модели (П, P(•)) из заданного параметрического семейства {(П, P„(•)): и е и}. Выделенное вероятностное пространство (П, P(•)) в одних случаях будет адекватной моделью для данного статистически устойчивого эксперимента Э или управляющей системы [3-7]. В других случаях, когда по некоторому признаку требуется выполнить синтез управляющей системы Э, вероятностная модель (П, P(•)) объявляется её целевой или оптимизационной моделью. В [1, 2] для семейства {(П, Pи(•)): и е и} из
перестановочных распределений для построения (П, P(•)) предлагается использовать класс перестановочных и квазиперестановочных стратегий принятия решений. В этой работе, которая является непосредственным продолжением исследований из [1, 2], изучаются свойства класса экстремальных стратегий.
Ключввыв слова: управляющие системы, вероятностные модели, перестановочные распределения, перестановочные стратегии, квазиперестановочные стратегии, выборочные пространства, минимаксное значение функции риска.
Введение
Используя обозначения и выводы из [1, 2], приведем постановку проблемы и основные результаты из этих работ. Пусть при т > 2, N = ={0, 1, ...} и а е П вектор х = (хь х2, ..., хт) е е Мт является значением измерителя Е = (Ей Е2, ••, Ет) эксперимента Э, где отображение Е(а): П ^ Ыт . Если Vесть множество высказываний V относительно неизвестного параметра и е и и V = и = {1, 2, ..., т}, то отображение
V = ^(га): П ^ V определяет искомую модель
(П, Pv(•)) из семейства {(П, Ги(-)): и е и}. При заданном значении параметра и семейства
{Ри(х) = Pu({а: £(а) = х}): х е ^ } и х) =
=Pu({а: С(а) = v}|{а: £(а) = х}): V е V} определяют соответственно распределение вероятностей для £ на пространстве Мт и условное распределение для высказывания С(а) на пространстве V при фиксированном значении х е е Мт . Класс рандомизированных стратегий или решающих функций 5 = gu(v; х): и х V х Ыт ^ ^ [0, 1] обозначается через 5" и через Sc, если 5 = gu(v; х) = g(v; х). Равенства Pu({а: Е(а) = х, £(ш) = V}) = Ри(х^и^; х), и е и, х е Ыт ,
V е V, задают распределение случайного элемента (Е(а), С(ю)) на множестве Ыт х V из элементов у = (хь х2, ..., хт, V). В [1] при фиксиро-
ванных значениях и е и и 5 е 5 наряду с вектором (Е1, £,2, ..., Ет, С) на (П, Pu(•)) рассматривается случайный вектор (уь у2, ..., ут, у) на выборочном вероятностном пространстве
(Кт х V, 2"т х V, Ри, /О), где у1(у) = х1, у2(у) = х2, ., 7т(у) = =хт, у(у) = V и Ри, 4({(х, V)}) = р„(х^„^; х). Если функция потерь 1(и, V) равна нулю при и ф V и единице при и = V, то функция риска вида Н(и, 5) = Ми, ¿(1(и, у)) = Ри, ¿({у: у(у) ф и}) определяет вероятность ошибочного выбора адекватной или целевой модели из класса {(П,
Pu(•)): и е и}. Выделение из данного класса
{(П, Pu(•)): и е и} модели (П, P(•)) с помощью стратегии 5+ = gu+(v; х) е 5, которая определяется из решения функционального уравнения оптимальности тах {Р ({у: у(у) ф и}): и е и} = = тДтах{Ри>
5({у: у(у) ф и}): и е и}: 5 е 5}, и есть основная изучаемая проблема в [1, 2] и в данной работе.
Множество квазиперестановочных минимаксных стратегий
Для любого вектора х = (хь х2, ..., хт) е Ыт определим функцию р*(х1, х2, ..., хт) = = тах{ри(х\, х2, ..., хт): и е и} и множество L(x\,
x2, хт) = {и: pu(x\, x2, хт) = р (x\, x2, .
хт)}. Рассмотрим попарно непересекающиеся
множества L](x1, х2, ..., хт) = {а(/, 1), а(/, 2), ..., а(/, с(/))}, / = 1, 2, ..., е(х). Положим, что П есть множество всех взаимно однозначных отображений вида тс(/): {1, 2, ..., т} ^ {1, 2, ..., т} и для некоторого и е L/(x1, х2, ..., хт) будет также и е L(x1, х2, ..., хт). Тогда хи = Ь/, и при любом k = 1, 2, ..., с(/) в силу определения 1 из [1] имеем равенствар*(хь х2, ..., хт) = ри(х1, х2, ..., хт) = = Рл(а(/, ед(хЬ х2, ., хт) = Ра/, ^1, х2, ., хт), если только отображение е П, п(а(/, k)) = и, %(и) = а(/, k), тс(/) = I при IФ а(/, k), IФ и. Отсюда следует, что а(/, k) е L при всех k = 1, 2, ., с(/). Итак, при х = (хь х2, ..., хт) е Nm либо Lj(x1, х2, ..., хт) с L(xl, х2, ..., хт), либо имеет место соотношение Lj(xu х2, ., хт ) П L(Xl, х2, ..., хт) = = 0. С другой стороны, множество
L(x1, ^ хт) с
С
e( х)
У Lj О^ ж^..^ хт) = {l, 2m}.
= 1 - — У К(х^ Х2 , xm ^ Р* (xl, х2 , хт ).
х1 <х2 < ... <хт
Итак, для любой стационарной квазиперестановочной или все равно для стационарной перестановочной стратегии 5 = х) выполняются неравенства:
Н (5) > 1 - — У \ (х1, х2,..., хт )| Р* (х1, х2,..., хт ),
ГЦ ^^ 1 1
m
Х1< Х2 <
/=1
Поэтому
L(x1, x2, хт) = Ц'(1)( x1, x2, хт) У
У ^(2)( х1, х2, ., хт) У ... У Lj(r)( х1, х2, . , хт), (1) где {/(1), /(2), ..., /(г)} = {/■: / е {1, 2, ..., е(х)}, ^(хь х2, ., хт) с L(Xl, х2, ., хт)} и для определенности /(1) </(2) < ... </(г).
Определение 1. Любой вектор х = (х1, х2, ..., хт) е Nm назовем информативным, если р*(х1, х2, ..., хт) > 0. В противном случае вектор х = (х1, х2, ..., хт) будем называть неинформативным.
Теорема 1. Для того чтобы стационарная квазиперестановочная стратегия 5 = к(у; х) была минимаксной относительно класса 5"' [2], необходимо и достаточно, чтобы на каждом информативном векторе х = (х1, х2, ..., хт) е Nm имело место соотношение
У яО;xl, x2,хт) =1. (2)
vеL( x1, х2^ , хт )
Доказательство. Достаточность. Принимая во внимание для стационарной стратегии соотношения (8) и (15) из [2] и определение функции р*(х1, х2, ..., хт), последовательно выводим:
Н (5) = 1 - - У \\ (х1, х2,..., хт )| X т ^^
х! <х2 < ... <хт
X У с(/)рk (\,/ (х))я(k; \ / (х)) >
/=1
> 1 - — У |w(xl, хт1\ х т
х! <х2< ... <хт
е( х)
Х Р (x1, х2 , ..., хт )У с/к ^ , / (х)) =
j=1
H(s) > inf{max{P„, s({y: у(у) * u}): u e U}:
s e S' } = Ho( S' ). (3)
Напомним из [2], что величина H0( S ' ) определяет относительно класса S' минимаксное значение функции риска H(u, s).
Очевидно, что произвольная стационарная квазиперестановочная стратегия s = g(v; х1, х2, ..., хт), для которой выполняется условие (2), равна нулю при v g L(x1, х2, ..., хт) и принимает неотрицательное значение при v e L(x1, х2, ..., xm). С учетом этого, используя представление множества L(x1, х2, ..., xm) с помощью равенства (1), рассмотрим любое v e L()( х1, х2, ..., xm) = {a(j(l), 1), a(j(î), 2), ..., a(j(î), c(j(l)))} для некоторого фиксированного l = 1, 2, ..., r. Так как рассматриваемая стратегия s = g(v; х1, х2, ..., xm) является стационарной и квазиперестановочной, то для всех i = 1, 2, ..., c(j(l)) с помощью равенства Хадо), 1) = Xaji), i) = ¿да легко устанавливается соотношение
g(a(j(l), 1); xl, .Х2 xa(j(l), 1) , xa(j(l), г> xm) =
= g(a(j(l), i); Х1, Х2, Xaj(l), 1) , Xaj(l), i), Xm)= = g(a(j(l), i); Х1, Х2, ..., Xm),
если только отображение тс(-) e П, a(j(l), 1) = =%(a(j(l), i)), n(a(j(l), 1)) = a(j(l), i), %(n) = n при n Ф a(j(l), 1), n Ф a(j(l), i). Поэтому стратегия s = =g(v; x1, x2, ..., xm), которая удовлетворяет достаточным условиям теоремы, имеет следующий вид:
g(v;^x2,..., xm) =
0 при v g L(x1, x2,..., xm);
= « gK^X 1); x1, x2 , ..., Xm )
для всех v e Lj(l) (x1, x2,..., xm ),
где l = 1, 2, ..., r. Формула (4) позволяет определить стратегию s = g(v; x) для всех v = 1, 2, ..., m. В силу соотношения (8) из [2] и (4) для рассматриваемой здесь стратегии s = g(v; х) выполняется равенство
¿c(j(l))g(a(j(l), 1); .1, x2,..., Xm) = 1. (5)
l=1
Принимая во внимание равенства
Рк(Кк,j(l)(x)) = Р*(Х1, X2, Xm), k e {1,2, m}, l e {1, 2, ..., r}, соотношения (4) и (5), непосредственно из (15) работы [2] для любой ста-
(4)
ционарной и квазиперестановочной стратегии 5 = g(v; х), которая удовлетворяет условию (2), найдем:
Н (5) = 1 - -т
е( х)
(x\, x2,..., хт ) х
х1 <х2 < .. <хт
х 2 Ф) Рь (№, / (х))я (к; № и (х)) =
/=1
1 г
= 1--2 №(х1, х2,..., хт)|2Ф(0)х
х1 <х2 < ... <хт I=1
х Р* (X\, х2 , ..., хт )g (a(j(l), 1); ^ х2 , ..., хт ) =
= 1 - — 2 № (X\, х2 , ..., хт ^Р* (X\, х2 , ..., хт X
И/1 ^^ 1 1
т
Н(5) = 1 - - 2№(х\, х2,..., хт) х т ^^
х\ <х2 < ... <хт
х Р" (X\, х2 , ..., хт ) = Н 0(5> ').
= 1 - т "\ 2 №^ х2 , ..., хт ^ х
х1 <х2 < .. <хт
х 2 Ф) Рь (№, / (х))§ (к; №,; (х)) =
= 1 - т- 2 |W(X\, х2 , ..., хт )|
х 2 Ф) Рь (№, у (х))§ (к; № и (х)) -
/=\
е( х')
- т-\ |№(х\\ , x2,..., х'т )|2 С(Л х
(8)
х1 <х2 < .. <хт
Учитывая это, соотношение (3), утверждения теорем 2, 3 и 4 из [2], получим: Н(5) = тДтах{Ри,5({у: у(у) ф и}): и е и}: 5 е е 5 ' } = Н0( 5'). Поэтому любая стационарная и квазиперестановочная стратегия, которая удовлетворяет соотношению (2), является минимаксной относительно класса 5 '.
Нвобходимость. Предположим, что некоторая стационарная квазиперестановочная стратегия 5 = х) является минимаксной относительно класса 5 ', и значит,
(6)
Однако для такой стратегии всё же существует
информативный вектор X = (х\, х2,...,х'т) е Ыт ,
для которого при некотором элементе /0 из множества {1, 2, ..., е(х')} и при некотором элементе /0 из множества {1, 2, ..., с(/0)} выполняются соотношения
g(a(jo, /0); х1, х2,..., хт ) > 0,
а(/0, ?о) гL (х\,х2,...,х'т),
а(/0, /0) е Ljo(x1, x2,..., хт ) =
= {а(/0, 1), а(/0, 2), ., а(/0, с/)}. (7) Из (7) выводим, что необходимое условие (2) не выполняется. В этих обозначениях и предположениях из (15) работы [2] для стратегии 5 = g(v; х) получаем:
Н(5) = 1 - Рк, 5({у: у(у) = к}) =
х Рк (№, / (X ))§ (к № / (X)).
Так как а(/0,/0) й L (х\, х2,..., хт), то
Рк(№к,/0(х))-Р*(х[,x2,...,хт)<0. Стратегия 5 = =g(v; х) является квазиперестановочной. Поэтому выбор отображения Р(-) е П, а(/0, /0) = Р(к), Р(и) = п при п ф к и условие (7) позволяют установить, что
§ №,Л(х')) =
= §(к, х1 , х2 ,..., хк-\, х' а (/0,10), хк+\,..., хт ) = =g(a(jo, /0); x\\,x2,...,хт) > 0.
Непосредственно отсюда имеем:
Фс)Рк (№к,/0(х'))§(к;№к,/0(х')) = = (Фс) -1) Рк (№ ,/0 (X' ))§ (к; № ,/0 (X)) + + Рк (№/&))§ (к;№к,Л(х')) + +р" (х1 , x2,..., хт (к; №, Л (х)) -- Р" (х1 , X2,..., хт (к';№к/0(х)) = = { (Фо) -1)Рк (№к/ (X'))§ (к; №к,/0 (X)) + + р* (х1 , х2,..., хт )§ (к ;№к,/0 (х'))} + +{ (Рк(№(х'))-р'(х1 ,х2,...,хт))§(к;№к,Л(х')) }<
< р' (х1 , х2,..., хт М/,) § (к;№к, /0 (х')) +
+{ (Рк(№кл(х'))-р*(х1 ,х2,...,хт))§(к;№к,/0(х')) }<
< р* (х1 , х2,..., хт Мл) § (к; №к, /0 (х')). (9) Учитывая (8) и (9), для минимаксной стратегии 5 = х) относительно класса 5 ' получаем соотношение:
Н(5) = 1 -т- 2№(х\, х2,..., хт) х
х1 <х2 < .. <хт , {x1,х2,..., хт }ф ф{xi, x2,..., хт }
х 2 с(/) Рь (№к, / (х))§ (к; №к, / (х)) -
- т-1 № (х\\, х2,..., хт ) х
х 2 Ф) Р* (^к, / (х' ))§ (к , / (X)) >
х1 <х2< ... <хт , {х1,(х2,..., хт}ф ф{х1, х2,..., х'т }
> 1 - т-\ 2 № (x\, х2 , ..., Хт ) Р* (X\, х2 , ..., Хт ) -
. < хт,
хт }ф ., х'т }
- т-№ (х1, х2,..., хх ) х
х1 <х2 < ... <хт,
{х1,х2,..., хт }ф
ф(х1, х2,..., хт }
х У Ф)рк \ / (х'))к (к; \ / (х')) -
/=1, ] Ф/о
- т- \\(х', х2,..., хт )| с(/о) X
х рк (\ ,/о( Х))К (к ,/о( х')) >
> 1 - т"' У \ (xl, x2,..., хт ^ р * О^ X2,..., хт ) -
х1 <х2 < .. <хт , {х1,(х2,..., хт}Ф Ф{х1, х2,..., хт }
-т"' \\(х',х',...,хт)| Уф) х
/-1, / Ф/о
х р*(х1, x2,..., хт) к(к; \, /(х,)) -
- т- \(x1', хт )| с(/о) х X р* (х', х2,..., хт) к (к;\,/0(х')) =
= 1 - У \ (xl, х2 , ..., хт ^ р * (xl, х2 , ..., хт ) -
х1 <х2 < ... <хт , {х1,(х2,..., хт}Ф Ф{х1, х2,..., хт }
- т~' (xll, x2,..., х'т ^ р * (xll, x2,..., х'т ) х
X У Ф) к (к;\к, / (х')) =
/=1
= 1 - У \ (xl, х2 , ..., хт ^ р * (xl, х2 , ..., хт ) -
х1 <х2 < ... <хт , {х1,(х2,..., хт}Ф Ф{х1, х2,..., хт }
- т 1 (х1, хт ^ р* (х1, x;,..., хт ) =
= 1 - У \\(X1, х2 , ..., хт ^р* (X1, х2 , ..., хт X
х1 <х2< ... <хт
Итак,
Н (5) > 1 -
- ~ У \(х" х2' ...' хт )\р' (х1> х2. ..., хт ).
Т-М ^^ 1 1
т
(10)
р„ (хи х2) = 16, еслих' = х2 их', х2 е {0,1,2};
= < 14, если х' + х2 = 1;
0 для остальных значений х' и х2.
Семейство {ри(х', х2): (X', х2) е N 2} является перестановочным, так как оно не зависит от значений параметра и и выполняется условие симметрии из леммы 1 работы [1]. Легко установить, что р*(х', х2) = ри(х', х2) для всех и е {1, 2}. Поэтому L(x1, х2) = {1, 2}. Отсюда следует, что стратегия 5 = ¿(у; X', х2) = 1/2 при V е {1, 2} удовлетворяет условиям теоремы 1 и, следовательно, является минимаксной относительно класса 5'. Для этой стратегии из соотношения (6) получим, что значение функции риска Н5) = =1 - 2 (3/6 + 2x1/4) = 1/2. Рассмотрим теперь другую стационарную стратегию 5Л = X', х2):
1, если X' = х2;
ЯЛ (1; xl, х2) = 1
ял (2; xl, х2) =
0, если X' ф х2, 0, если X' = х2;
(11)
> х1 <х2 < ... <хт
Это неравенство противоречит (6), и необходимость условия (2) доказана от противного. Утверждение теоремы 1 установлено.
Множество стационарных минимаксных стратегий
Теорема 1 описывает подмножество минимаксных стратегий относительно класса 5', которые являются элементами из множества всех стационарных и квазиперестановочных стратегий. Однако существуют минимаксные стационарные стратегии относительно класса 5', которые не являются квазиперестановочными. Для установления этого факта рассмотрим простой пример. Пусть при каждом заданном значении параметра и е и = {1, 2} семейство {ри(хь х2): (X', х2) е N 2} распределений для вектора (£,', ^2) определяется равенством вида
1, если X' Ф х2.
Для отображения %(1) = 2 и % (2) = 1 имеем: ЯЛ(%(1),0,0) Ф кл(1;0,0). Поэтому стратегия 5Л = = ял (V; X', х2) не является квазиперестановочной. С другой стороны,
Н(и, 5Л) = 1 - Ри,5л ({у: у(у) = и}) =
= У рИ(хь х2)ял(и; X', х2).
(х1, x2)еN 2
Тогда из (10) и (11) получаем, что Н(1, 5Л) =
= У ри(х', х2) = 1/2 и Н(2, 5Л) = У ри(х', х2) =
X' = х2 X' Ф х2
=1/2. Значит, Н(5Л) = тах{Н(и, 5Л): и = 1, 2}= =1/2, и на основании теоремы 4 из [2] стратегия 5Л = X', х2) является минимаксной относительно класса 5'. Итак, показано существование стационарной минимаксной стратегии относительно класса 5', которая не является квазиперестановочной. В связи с этим установим фундаментальное свойство такого рода минимаксных стратегий.
Теорема 2. Если стационарная стратегия 5 = ё(у; х) является минимаксной относительно класса 5', то на любом информативном векторе х = (X', х2, ..., хт) е Nm имеет место (2).
Доказательство. По теореме 4 из [2] существует такая не зависящая от значения и неизвестного параметра квазиперестановочная стратегия
и
№ = х) =
т
= (т!)-'У У К(к; ха(1), Xа(2),..., ха( т)) , (12)
к=1 а(г) еП (к ,у)
для которой Н(5) > Н(50). Так как стратегия 5 = к(у; х) является минимаксной относительно класса 5', то стратегия 5|(0'1 = к(0)(у; х) также будет минимаксной относительно класса 5'. Для
стационарной, квазиперестановочной и мини-
(0) (0)
максной стратегии 5 = к (V; х) относительно класса 5' по теореме 1 выполняются равенства 5(0) = К(0)(у; X', х2, ., хт) = 0, V Й L(Xl, х2, ., хт), на каждом информативном векторе х = (X', х2, ..., хт) е Nm . Используя теперь равенство (12), легко найдем:
0 = У К(0)(у; ^ х2 , хт ) =
x1, x2,., хт )
= У (т!)-1 х
УЙН x1, x2,..., хт )
' У У к (к; ха(1), ха(2),..., ха(т)) = У (т!)1 X
к=1 а(1) е П(к,у)
уШ, x1, x2,..., хт)
У У к (к; ха(1), ха(2),..., ха(т)) +
к=1,к фу а(1) еП (к ,у)
У (т!)-' У К(к;ха(1), ха(2), ..., ха(т) ) >
уйДX',х2,...,хт) а(/) е П(у,у)
> (т! )-1 У Я (у; X', х2,..., хт) > 0.
xl, x2,..., хт )
Непосредственно отсюда легко получаем, что
У К(у; x1, х2 , ..., хт ) = 0
и
(13)
уИ( x1, x2,..., хт )
У ё (у; X1, х2 , ..., хт ) = 1
уеИ x1, x2,..., хт )
так как У к (у; X', х2,..., хт) = 1. Значит, усло-
V = 1
вие (2) выполняется, и это условие одновременно является необходимым.
Экстремальные стратегии и их свойства
В этом разделе рассмотрим два типа специальных стационарных стратегий. Особый интерес к этим стратегиям объясняется рядом причин. Во-первых, такого рода стратегии часто используют при решении практических задач. Во-вторых, эти стратегии очень просты в вычислительном отношении. В-третьих, они являются минимаксными для целого класса
{р„(хьх2, ..., хт): (X', х2, ..., хт) е ^ } распределений вектора (£,', ..., £,т). Наконец, эти стратегии обладают свойством адаптивности к изменениям распределения {ри(х', х2, ..., хт): (х', х2, ..., хт) е Nm }. Первый тип стратегии будем обозначать через 57 = к'(у; X', х2, ..., хт), её конструкция учитывает экстремальные свойства распределения вектора (£,', ..., £,т).
Лемма 1. Пусть стратегия 57 = к'(у; X', х2, ..., хт) задается равенством
К ' (у; xl, х2 , ..., хт ) =
0 при Vй ¿(X', х2,..., хт);
= < ^О^ х^..^ хт )|-'
для всех V е ¿(X', х2,..., хт),
где ¿(X', х2, ..., хт)| есть число элементов множества ¿(х', х2, ..., хт). Тогда стационарная стра-
V V, \
тегия 5 = к (у; X', х2, ..., хт), которая определяется формулой (13), является квазиперестановочной и минимаксной относительно класса 5'.
Доказательство. Для любого отображения %(•) е П выполняются равенства р*(х', х2, ..., хт) = = тах{р„(х' , х2, ., хт) : и е и} = тах{р%(„)(х1, х2, ., хт): и е и}. Так какр*(х%(1), х%(2), ., х%(т)) = = тах{р„(х%('), х%(2), ..., х%(т)): и е и} и имеет место соотношение р%(и)(х', х2, ..., хт) = = Рu(x%(1), x%(2), то р (X', х2, ., хт) =
= р*(х%(1), х%(2), ..., х%(т)). Пусть ¿(х%('), х%(2), ...,
х%(т)) = {и: ри
(х%(1), х%(2), ..., х%(т)) = р (х%(1), х%(2), ..., х%(т)), и е и} = {и', и2, ..., uí} с {1, 2, ..., т}, тогда ¿(X', х2, ..., хт) = {и: ри(х', х2, ..., хт)= = р*(х', х2, ..., хт), и е и} = {%(и'), %(и2), ..., %(щ)}. Действительно, если и е {и', и2, ..., и},
то Рu(x%(1), x%(2), х%(т)) = р (x%(1), x%(2), х%(т))
илир%(и)(х', х2, ., хт) = Р*(х', х2, ., хт), т.е. %(и) е е {%(и'), %(и2), ..., %(щ)}. Наоборот, если %(и) е е{%(и'), %(и2), ..., %(щ)}, то Р%(и)(хЬ х2, ..., хт) = = Р*(х1, х2, ..., хт) или Ри(х%(1), х%(2), ..., х%(т)) = = Р*(х%(1), х%(2), ..., х%(т)), т.е. и е {и', и2, ..., щ}. Следовательно, |L(xl, х2, ..., хт)| = ¿(х%(1), х%(2), ., х%(т))| = t. Из формулы (13) получим:
К17 (у; xl, х2 , ..., хт ) =
[0 при V й {%(щ), %(и2),..., %(щ)}; "' для всех V е {%(щ), %(и2),..., %(щ)},
К (У; х%(1), х%(2) , ..., х%(т) ) =
[0 приVй{Щ',и2,...,и1};
[t4 для всехVе{и',и2,...,и1}.
Из (14) при V = %(и) е {%(и'), %(и2), ., %(ut)} получаем к7(%(и); X', х2, ., хт) = Г1, а из (15) при V = и е {и', и2, ..., ut} находим ¿'(и; хпо, х%(2), ., х%(т)) = Г1. Сравнивая эти резуль-
(14)
(15)
х
+
таты, выводим, что §У(л(и); х\, х2, ..., хт) = ¿'(и; хп(\), хл(2), ..., хп(т)) = Г при и е {и\, и2, ..., и}. Аналогично показываем, что §'(л(и); х\, х2, ..., хт) = §'(и; хп(\), хл(2), ., хл(т)) при и £ {и\, и2, ., и}. Итак, стационарная стратегия 5У = gV(v; х\, х2, ., хт) является квазиперестановочной. Из (13) следует, что для этой стратегии имеет место соотношение (2). Отсюда по теореме 1 экс-
v v, \
тремальная стратегия 5 = § (V; х\, х2, ..., хт) будет минимаксной относительно класса 5 '. Лемма 1 доказана.
Изучим теперь свойства второго типа экстремальной стационарной стратегии, которую ниже будем обозначать через 5У = х\, х2, ..., хт). Алгоритм построения этой стратегии основан на экстремальных свойствах числовых значений х\, х2, ..., хт измерителей Е\, Е2, ., Ех. Пусть множество Lv(x\, х2, ..., хт) = {к: хк = = тах{х\, х2, ..., хт}, к = 1, 2, ..., т} для любого вектора х = (х\, х2, ., хт) е Ыт .
Теорема 3. Для того чтобы стационарная стратегия
§ V (V; x\, x2,..., хт) =
§ С^; хл(\), хл(2),..., хл(х)) =
0 приVгЦ,v2,...,vr}, г-1 для всех Vе v2,...,vr};
§ v (v; ^ x2,..., хт) =
(18)
(16)
0 при V г V (х\, х2,..., хт),
= <\Г (x\, x2,..., хт )|-1
для всех V е V(х\, х2,..., хт)
была минимаксной относительно класса 5 ', необходимо и достаточно, чтобы для каждого вектора х = (х\, х2,...,хт) е Ыт выполнялось соотношение
Lv(x\ , х2, ., хт) С 2(х\, х2, ..., хт). (17) Доказательство. Нвобходимость. Сначала найдем множества 1?(х\, х2, ..., хт) и 2^хл(\), хп(2), ..., хл(т)) для любого фиксированного отображения •л:(-) е П. Пусть величина xv = = тах{х\, х2, ..., хт}. Из определения отображения тс(-) следует, что тах{хЛ(\), хП(2), ..., хл(т) } =тах{х\, х2,...,хт}. Поэтому xv = тах{хЛ(\), хП(2), ..., хп(т)}. Если теперь 2^хл(\), хп(2), ..., хп(т)) = = {V: хпМ = Xv, V = 1, 2, ..., т} = {v\, V2, ..., Vг} с с{1, 2, ..., т}, то Lv(x\, х2, ..., хт) = {V: х^, = xv, V = 1, 2, ..., х} = {тс(у\), тс(у2), ..., тс(^)}. В самом деле, если V е е 2^хЛ(\), хП(2), ., хП(т)),
то хП(„) = xv, и поэтому е Lv(x\, х2, ..., хт) = {тс(у\), тс(^), ..., тс(уг)}. Иначе, если тс^) е ТС^), ..., = = LV(X\, х2, ..., хт), то
v Т V/
х^) = х , и в силу определения V (хП(\), хП(2), ..., хП(т)) получаем, что V е еLV(xЛ(\), хП(2), ., хП(т)) = {v\, v2, ..., vг}. Суммируя все эти результаты, выводим, что \[?(х\, х2, ..., хт)\ = ^(х^), хп(2), ..., хП(т))\ = г. Принимая теперь во внимание определение стратегии 5V с помощью равенства (16), найдем, что
[0 приVё{я(>\),я(>2),...,)}, (19)
[г - для всех V е ), ),..., )}.
Из (18) при V = и е v2, ..., vг} имеем хП(\), хЛ(2), ., хП(т)) = г-1, а из (19) при V = %(и) е е{тс^\), тс^), ..., получаем gv(тс(u); х\, х2,
..., хт) = Г1. Отсюда выводим, что х\, х2,
.••, хт) = ¿'(и; хЛ(\), хП(2), ..., хП(т)) = г- при и е е{v\, v2, ..., V,}. Совершенно так же установим следующее равенство: gv(л(u); х\, х2, ..., хт) = = gv(u; хП(\), хП(2), ., хП(т)) = 0 при и г {V\, V2, ., vг}. Следовательно, стационарная стратегия 5V = =gV(v; х\, х2, ..., хт) является квазиперестановочной.
Для завершения доказательства этой части теоремы предположим сначала, что вектор х = (х\, х2, ..., хт) является существенным. Тогда для квазиперестановочной и минимаксной стра-
v v/ \
тегии 5 = § (V; х\, х2, ..., хт) относительно класса 5 1, которая является стационарной, по теореме 1 выполняется равенство (2). Используя это и (16), легко найдём:
2яv(у;^ х^• хт) =
x1, x2,•, хт )
2яv(v;x\, x2,хт) =
( хЬ х2^ , хт )
Предположим теперь, что существует v0 е
еLV(x\, х2, ..., хт) и v0 г Lv(x\, х2, ..., хт). Так как стратегия 5V = х\, х2, ..., хт) = г- > 0 при
V е LV(X\, х2, ..., хт), то gV(Vo; х\, х2, ..., хт) > 0. Поэтому получаем противоречие
2§(v; ^ x2, хт) +
УеД x1, x2,•, хт )
+ gV(vo; х\,х2, ...,хт) > 1. Значит, необходимое условие (17) выполняется, если вектор х = (х\,х2, ., хт) является сущест-венн^1м. Остаётся допустить, что вектор х = (х\, х2, ., хт) будет несущественным. Отсюда множество 2(х\, х2, ., хт) = {1, 2, ., х}, и соотношение Lv(x\, х2, ., хт) с 2(х\, х2, ., хт) ={1, 2, ., т}, естественно, имеет место.
Достаточность. Для стационарной квазиперестановочной стратегии 5V = gV(v; х\, х2, ., хт) справедливо равенство
2яv(v; ^ x2, хт) =
vеLV ( x1, х2^ , хт )
Теперь из соотношения (17) получаем, что 2Яv(V; х\, х2, хт) = 1. Поэтому по тео-
Уе2( x1, X2,•.-, хт )
реме 1 стратегия 5 = к (у; X', х2, ..., хт) будет минимаксной относительно класса 5'. Теорема 3 установлена.
Приведем несколько примеров, в которых условие (17) имеет место, и также рассмотрим пример, когда условие (17) не выполняется.
Пример 1. Пусть числа X > 0 и ц > 0 определяют распределение w(n) = е-ХХп/п! на N и рас-
ц х1 + х2 + .+ хт
пределение р(х', х2, ..., хт) = -е~тц
х'!х х2!х ... х хт!
на Nт. Если произвольное отображение %(•) е еП, то компоненты вектора (х%о, х%(2), ..., х%(т)) получаются путем перестановки компонент вектора (X', х2, ..., хт). Поэтому х%о + х%(2) + ... + +х%(т) = X' + х2 + ... + хт, (х%('))! X (х%(2))! X ... X х (х%(т))! = (X')! X (х2)! X. X хт! и р(х%('), х%(2),
х%т+х%г?1)+...+х%|
. • х%(т))
Ц
(х%(1) )! х (х%(2) )! х "-х (х%( т))!
х2, ..., хт), и, значит, распределение {р(х', х2, ..., хт): (X', х2, ..., хт) е Nm } будет симметричным. Тогда на основании содержания и доказательства леммы 1 из [1] выводим, что распределение
ри(х1, х2, ., хт) =
хи
= У ™(х')Р(^ х2 , ..., X - х', ..., хт ) =
= е
т х^ -(Х+тц )ТТ _Ц_
П 4т У^ц-1) х'тх
(х„)!
(X)!(хи - X)!
х а
(хи +1)(1 - а)т+' ах' ++х2 + + хт при а = Ь,
(1 - Ь)(1 - а)та
т X' ++х2 + ...+х^
1 - (Ь / а)хи+ 1 - (Ь / а)
(20)
-е-тц =р(х',
при а Ф Ь
будет перестановочным. Из (20) следует, что Ь~Хх', х2, ..., хт) = ¿(X', х2, ..., хт). Итак, стратегия 5У = к (у; X', х2, ..., хт) для этой задачи будет также минимаксной относительно класса 5 .
Пример 3. Пусть целое число с > 0 определяет распределение w(n) на N которое равно единице при п = с и нулю при п Ф с. Пусть w2 = ^2(п):п е N} - некоторое распределение на N W2(n)>0 при всех nеN, и функция w2(г - с)/ w2(г) при г > с монотонно не убывает по г. Симметричное распределение р(х', х2, ..., хт) на Nт в этом примере будем задавать соотношением р(хь х2, ..., хт) = w2(x1) х w2(x2) х
хи
X...XW2(Xm). Если ри(х', х2, ..., хт) = У w(X ') x
х =0
х р( xl, х2, ..., хи - х', ..., Хт), то
0 при хи < с, Щ(хи - с)
Ри С^ x2, хт ) =<
П W2(xí) (21)
= (1 + (Хц-1))х"е-(Х+тц) П—,
и х,!
(X', х2, ..., хт) е Nm,
для вектора (£,', ..., £,т) является перестановочным. Более того, из окончательной формулы для ри(х', х2, ..., хт) непосредственно получаем, что для любого вектора (X', х2, ..., хт)е Nm множество {и: хи = тах{х', х2, ..., хт}, и = 1, 2, ..., т} = {и: Ри(х', х2, ..., хт) = Р*(хЬ х2, ..., хт)}, т.е. ¿(X', х2, ..., хт) = ¿^(х', х2, ..., хт). Поэтому
v v/ \ ~
стратегия 5 = к (у; X', х2, ..., хт) для этой задачи будет минимаксной относительно класса 5 . Пример 2. Пусть р(хь х2, ..., хт) = (1 - а)т х
+хт , (X', х2, ..., хт) е Nт, 0 < а < 1, и w(n) = (1 - Ь)Ьп, п е N, 0 < Ь < 1, задают распределение на Nт и, соответственно, на N. Используя метод, который был предложен для решения вопросов примера 1, легко показать, что распределение
ри(х1, х2, ., хт) =
хи
= У ™(х')Р(^ х2 , ..., X - х', ..., хт ) =
х' = 0
^(хи ) ,=1
При х„ > с.
По лемме 1 из [1] распределение (21) будет перестановочным. Легко видеть, что при тах{х', х2, ., хт} < с будетРи(х', х2, ., хт) = 0 для каждого и е и. Поэтому имеем ¿(X', х2, ..., хт) = {1, 2, ..., т}, LV(x1, х2, ..., хт) с ¿(X', х2, ..., хт). Так как функция w2 (г - с) / w2 (г) при г > с монотонно не убывает по 2 и тах{х', х2, ..., хт} > с, то непосредственно из (21) снова имеем ¿^х', х2, ..., хт) с ¿(X', х2, ..., хт). Для этой задачи по теореме 3 стратегия 5V = к (у; X', х2, ., хт) будет опять минимаксной относительно класса 5 .
Рассмотрим теперь простой пример, когда соотношение (17) не имеет места.
Пример 4. Пусть т = 2, а распределение ^(п): п е N1 на N и распределение {р(хь х2): (X', х2) е N 2} на N 2 удовлетворяют ограничениям w(1) > 0, р(1, 0) = р(1, 1) = 0, р(0, 2) > 0. Тогда в соответствии с условиями и формулами леммы 1 из [1] легко найдем, что х1
Р' (X', х2) = У w(х')р(X' - х 1, х2), X=0
х2
р2 (X', х2) = У w(x1)р(X', х2 - х'), X=0
Р\ (х\, х2) = 2 X)р(х\ - X 1, х2),
X=0
х2
р2 (х\, х2) = 2 н(х1)р(х\, х2 - X).
х'=0
Отсюда с учётом принятых ограничений непосредственно получим, что
Р\(1, 2) = Н(0)р(1, 2) + Н(1)р(0, 2), Р2(1, 2) = н(0)р(1, 2) + н(1)р(1, 1) + +н(2)р(1, 0) = н(0)р(1, 2), р\(1, 2) > р2(1, 2). Поэтому, принимая во внимание определение множеств х2) и 2(х\, х2), выводим, что
Lv(1, 2) = {2} и 2(1, 2) = {1}. Следовательно, соотношение (17) не выполняется. Поэтому экстремальная стратегия вида 5V = gV(v; х\, х2) для этого примера может не быть минимаксной относительно класса 5'.
Стандартные семейства вероятностных моделей
Рассмотрим теперь стандартные семейства вероятностных моделей управляющих систем, которые представляют практический интерес.
п
Теорема 4. Пусть функция 2 Н X) х
X=0
х н2(п - X)н2(п)-\ монотонно не убывает по
п е N, где {м>(п): п е N1 и {н2(п): п е N1 - некоторые распределения на N и н2(п) > 0 для любого п е N. Тогда при каждом фиксированном и е и множество вида {ри(х\, х2, ..., хт): (х\, х2, ..., хт) е Nm }, где
Ри(x\,х2,...,хт ) =
\ хи Х (22)
= (н2 (хи )) 2 х') н2 (X - х 1 )П н2 (хк ),
X=0 к=\
является перестановочным распределением для вектора (Е\, Е2, ..., Ех), и стратегия 5V = gV(v; х\, х2, ., хт) будет минимаксной относительно класса 5'.
Доказательство. Из формулы (22) для ри(х\, х2, ..., хт) выводим, что функцияРи(х\, х2, ., хт) > > 0, и, кроме того, выполняются следующие равенства:
2 Ри (X\, х^.- хт ) =
(х\,х2,...,хт
2 (Н2(х„ ))-12^(х')>
(x1,x2,...,хт )еN'
х
Н2(X - х)П хк ) = 1 к=\ Л Л
и е и является распределением для вектора (Е\, Е 2, ., Е т). Из соотношения (22) при любом отображении •л:(-) е П получаем, что
рж(и) (х\, х2 , ..., хх) =
х%(и) т (23)
= 2 Н(х 1 )Н2 (хп(и) - х')П н2 (хк ) / н2 (хл(„) ),
х'=0 к=\
Ри (хл(\), хя(2), ..., хл( х)) = х*(и) т (24)
= 2 Н(х 1 К (хя(щ) - х)П Н2 (хк ) / н2 (х,(И) ).
х'=0 к=\
Из равенств (23) и (24) получаем, что Рж(и)( X\, х2 , ..., хх ) = Ри (XЛ(\), х^(2), ..., хл(х)) для каждого отображения е П. Итак, соотношение (22) определяет перестановочное распределение для вектора (Е\, Е2, . ••, Ех). Затем, так
п
как функция 2 н(п)н2(п - х ')/ н2(п) монотон-
X=0
но не убывает по п е N, то из (22) для любого (х\, х2, ..., хт) е Nm множество Lv(x\, х2, ..., хт) = = {V: хг, = тах{х\, х2, ..., хт}, V = 1, 2, ..., т} с с 2(х\, х2, ..., хт). По теореме 3 стратегия 5V = =gV(v; х\, х2, ..., хт) будет минимаксной относительно класса 5'. Утверждение теоремы 4 доказано.
Теорема 5. Пусть при любом фиксированном и е и выполняются равенства
Ри5- ({У: у\( У) = х\'
у 2 (У) = х2,..., у т (У) = хт , у( У) = v}) =
= ]2н(х')н2(хщ - х)П н2(хк) х (25)
X=0 к Фи
х gJ(v■; х\, х2, ..., хт), V е V, (х\, х2, ..., хт)е Nm , где {м>(п): п е N1 и {н2(п): п е N1 - некоторые распределения на N. Тогда случайные величины у\(у), у2(у), ..., ух(у) независимы на выборочном вероятностном пространстве (Nm х V, 2N х г, Р „ (•)), и экстремальная функция риска
да да
Н(5> 1 - 2 Н(х) 2 Н2(п - х) >
X=0 п=х'
ск
х2 ТГ Нк (п)?\Х-1-к (п -1), (26)
к =0 к + 1
где #\(-1) = 0 и q\(n) = q\(n -1) + н2(п) для всех п е N. В случае если н2(п) > 0 для любого п е N, то
Н(5> 1 - 1 2 Н(х') 2
н2 (п - х')
и = 1, 2, ..., т. Следовательно, семейство {ри(х\, х2, ..., хт): (х\, х2, ..., хт) е Nm } при каждом фиксированном
т х=0 п=х 1 н2(п) х [^т (п) - чС (п -1)]. (27)
Доказательство. Из равенства (25) получим, что для всех / Ф и имеет место:
Р V({у: 1,(у) = х1}) = Из определения стратегии 5 = к (у; X', х2, ...,
г хт) по формуле (16) и соотношений (31) найдём
= У У Уw(x')w2(ги - х') х вероятность
(Г',Г2,..., 1Я)е^, г,. = х,. У" х " (28) Ри,^ (Аи П ви) = Ри,^ ({У: у(у) = И тю^'СуХ
хП w2(zk) к v (V, г1г г2,..., г ) = w2(x.), ъСуХ 1т(у)} Ф 1и(у)}) = 0.
кФИ т Отсюда Р V ({у: 1(у) = и}) = Р V (Аи П Ви). По-
({у : У'( у) = х1, ЪОО = х2,..., 1т (у) = хт}) = этому ^ ^
= У У w(X)w2 (х„ - х ') X Н(5) = 1 - Р,IV ({у: 1(у) = и})=
= 1 - Ри,^ (Ви П Аи). (32)
События вида Ви;0, Ви; ¿о, ,(2), ..., ,(к), где 1 < к <
= Ум^Схи-х')Пw2(xk), (29) - ,(1) е и, ,(2) е и, .■; ¿(к) е и, ф и,
х'=0 к фи ¿(2) ф и, ..., ¿(к) ф и и ¿(1) < ¿(2) < ...< ¿(к), обра-
Р V ({у: 1 и (у) = хи}) = зуют разбиение события Ви. Тогда " " (Ви П Аы) = (В„;0 П Аы) и
"2\ ли у=1 х'=0
ХП w2(xk )К (v, ^ х2 , ..., хт ) =
к Фи
т ги \ и 11 И
я-1 Л
У У уу w(x')w2 (г„- х,) х
(21,22 2я )еNm , % = хщ " 1 х 0 и
X
П ^к )К 2р г2 , ..., 2Я ) =
и и (Вщ; 1 (1), ¿(2),..., /( к) П Аи)
у к=1 /(1)<¿(2)<... < /(к) у
2 к 1 2 т
к фи Учитывая теперь теоремы сложения, умноже-
ния и формулу (16), получим
Р V (Ви П Ащ) = Р V (В„;0) +
= У м>(х,)щ(хщ - х,). (30)
И, 5
я-1
Учитывая (29), (28) и (30), получаем соотноше- Я-1 '
ние следующего вида: + У У Р^ (Вщ;!,'),¿(2),...,¿(к)). (33)
Ри у ({ у : 1'( У) = X', 12 ( У) = х2,..., 1 я ( У) = хт }) = к=' к +1 /(1) < /(2) <..< /(к)
х Принимая во внимание соотношения (28), (29) и
= У w(x')W2(xи - х )ПW2(хк) (30) и определение всех событий вида ВЩ0, Вщ
х'=0 к Фи
на ( л хлттр а ( \ 'О- - г(k), найдем:
= РИ^ ({у: 1 и (у) = хи })ПР^({у: 1 ,(у) = X-}). » п
Ъ ' ¿Фи ' „ Р V(В 0) = У У w(X)w,(n -х')а1т-1(п-1)
Отсюда выводим, что случайные величины ; 4/24
1'(у), 12(у), ..., 1Я(у) независимы на выборочном
/■ лтЯ 1Г r\Nm х К
вероятностном пространстве (N х К, 2 ,
Ри,^ (О). = У У 4х 1 ^(п - х)w2к (п)дГ-1-к (п -1),
Перейдём к доказательству равенства (26). Рассмотрим события из 2N х К :
п=0 х '=0
р, „v (ви;/(1),¿(2)...../(к)) =
и;/(1), ¿(2),..., /( к V
к т-1-к
п=0 х'=0
1 < к < я - 2,
Аи = {у: 1(у) = и}, Вщ = {у: тах{1'(у), 12(у), ..., (Вщ;/(1),1 (2),..,/(т-1))
и
ЪгШ = ^(уЖ
Вщ = (X X К) \ Ви, (31)
Ви; 0 = {у: 1и(у) > 1,(у), 1 < / < Я, / Ф и}, Ви; ,(1) = {у: 1и(у) = 1,(1)(у) > 1,(у) ,
И,5
« п
= У У 4х ')w2(n - х)w2Я-'(п).
п=0 х'=0
Используя эти равенства в соотношении (33),
получим, что
/ е и \ {и, ¿(1)}}, ¿(1) е и, ¿(1) Ф и ..., т-1 ск » п
Ви; /('), /(2),...,,(к) = {у: 1и(у) = 1,(')(у) = 1,(2)(у) = Рщ^(Вщ П Ащ) = У-я-1У У w(x')х
=. = 1,(к)(у) > 1,(у) , , к=0 к + 'п=0 х=0 (34)
/ е и \ {и, ¿(1), ¿(2), ., /(к)}}, 1 < к < т - 2, х w2(n - X)w2к(п)^'Я-1-к(п -1).
¿(1) е и, ¿(2) е и, ..., /(к) е и, ¿(1) ф и, ¿(2) ф и, ..., /(к) ф и, ¿(1) < ¿(2) < ...< /(к),
Ви; ,(1), ,(2), ,(т - 1) = {у: 1и(у) = 1,(1)^) = 1,(2)(у) =
Учитывая равенство (34) в соотношении (32) и меняя порядок суммирования по п и по х', установим равенство (26).
Наконец, покажем равенство (27), если до-
. • • ^ 1 ,(т 1) (y)}, полнительно w2(n) > 0 для п е N.
¿(1) е и\ {и}, ¿(2) е и \ {и}, ..., /(т - 1) е еи \ {и}, /(1) < ¿(2) < ..< /(я - 1).
Действительно, выполним при w2(n) > 0, п е N, следующие преобразования:
а
У^-W2k (n)q m-1-k (n _ 1) = Tik +1
k-0 k + 1 m_1 çk+1
^ " -wk
-УТ^Лk (n)q1m_'_k (n _ 1)
mj-0 k +1
m
1 »
_ - y
111 VI— /ч
y cm (_1)kb(n+1)k _y cm (_1)kb
k=0 k=0 i » m
= 1 _—b-cyy cm(_1)kbnk(bk _ 1) =
rn n=c k=0
i да m
= 1 _—b-c yy cm (_1)kbnk (bk _ 1) =
i m да
= 1 _—b-c y cm (_1)k (bk _ 1)y bnk =
mm
m
=1—bc y cm (_1)k (bk _ 1)-m ti 1
bc
1 х
= 2 О/ (п)?Гк (п -1) =
= Ч\х (п) - Ч\х (п -1) хн2 (п)
Подставляя это выражение в (26), получим (27). Теорема 5 доказана.
Формулы (26) и (27) для вычисления экстремальной функции риска являются достаточно общими и, естественно, громоздкими. Однако в конкретных случаях, которые представляют практический интерес, выражение для Н(5/) можно значительно упростить. Проиллюстрируем это на примере.
Пример 5. Пусть с есть некоторое целое неотрицательное число и 0 < Ь < 1. Пусть также м>(п) равно единице при п = с и нулю при п Ф с, а н2(п) = (1- Ь)Ьп. Отсюда легко находим, что
п
q\(n) = 2 (1 - Ь)Ьх = 1 - Ьп+\ . Принимая это во
X=0
внимание, из (27) последовательно найдём:
1 да
Н^) = 1--ь-с 2[(1 - ьп+\)х - (1 - Ьп)х] = 1-
И/1
1 I m
= 1 +— b _ I y ck (_1)kbck +1 _ 1 m Itf
= 1 _ — b-c [1 _ (1 _ bc )m ]. m
_ bk
\
(35)
Список литературы
1. Федоткин М.А. Задача оптимизации для перестановочного семейства вероятностных моделей систем с управлением // Вестник Нижегородского университета им. Н.И. Лобачевского. 2012. № 5(2). С. 222-227.
2. Федоткин М.А. Свойства перестановочных и квазиперестановочных стратегий управляющих дискретных систем // Вестник Нижегородского университета им. Н.И. Лобачевского. 2014. № 2 (1). С. 191-198.
3. Zorine A.V., Fedotkin M.A. Optimization of Control of Doubly Stochastic Nonordinary Flows in TimeSharing Systems // Automation and Remote Control. 2005. V. 66. № 7. P. 1115-1124.
4. Пройдакова Е.В., Федоткин М.А. Управление выходными потоками в системе с циклическим обслуживанием и переналадками // Автоматика и телемеханика. РАН. 2008. № 6. С. 96-106.
5. Федоткин М.А., Федоткин А.М. Анализ и оптимизация выходных процессов при циклическом управлении конфликтными транспортными потоками Гнеденко-Коваленко // Автоматика и телемеханика. РАН. 2009. № 12. С. 92-108.
6. Fedotkin M.A. Construction and analysis of probability models for controlled evolutionary systems // Theory of Probability and Mathematical Statistics. 2012. V. 85. P. 133-147.
7. Федоткин М.А. Модели в теории вероятностей. М.: Наука-Физматлит, 2012. 608 с.
BUILDING A CLASS OF EXTREME STRATEGIES OF DISCRETE CONTROL SYSTEMS
M.A. Fedotkin
A statistical approach to separate the probability model (Q, if, PQ) from the given parametric family {(Q, if, Pu(0): u e U} has first been proposed in [1, 2]. In some cases, the separated probability space (Q, if, PQ) will be an adequate model for the given statistically stable experiment Э or controlling system [3-7]. In other cases, where it is required to
synthesize the controlling system Э by some criterion, the probabilistic model (Q, if, PQ) is declared to be its target or optimization model. It has been proposed in [1, 2] to use a class of permutation and quasi-permutation solution strategies
for the construction of (Q, if, PQ) from the family {(Q, if, PuQ): u e U} of permutation distributions. This work is a direct extension of studies [1, 2] and it considers the properties of a class of extreme strategies.
Keywords: control systems, probabilistic models, permutation distributions, permutation strategies, quasi-permutation strategies, sample spaces, minimax value of the risk function.
References
1. Fedotkin M.A. Zadacha optimizacii dlya perestano-vochnogo semejstva veroyatnostnyh modelej sistem s upravleniem // Vestnik Nizhegorodskogo universiteta im. N.I. Lobachevskogo. 2012. № 5(2). S. 222-227.
2. Fedotkin M.A. Svojstva perestanovochnyh i kvazi-perestanovochnyh strategij upravlyayushchih diskretnyh sistem // Vestnik Nizhegorodskogo universiteta im. N.I. Lobachevskogo. 2014. № 2 (1). S. 191-198.
3. Zorine A.V., Fedotkin M.A. Optimization of Control of Doubly Stochastic Nonordinary Flows in TimeSharing Systems // Automation and Remote Control. 2005. V. 66. № 7. P. 1115-1124.
4. Projdakova E.V., Fedotkin M.A. Upravlenie vyhod-nymi potokami v sisteme s ciklicheskim obsluzhivaniem i perenaladkami // Avtomatika i telemekhanika. RAN. 2008. № 6. S. 96-106.
5. Fedotkin M.A., Fedotkin A.M. Analiz i op-timizaciya vyhodnyh processov pri ciklicheskom uprav-lenii konfliktnymi transportnymi potokami Gnedenko-Kovalenko // Avtomatika i telemekhanika. RAN. 2009. № 12. S. 92-108.
6. Fedotkin M.A. Construction and analysis of probability models for controlled evolutionary systems // Theory of Probability and Mathematical Statistics. 2012. V. 85. P. 133-147.
7. Fedotkin M.A. Modeli v teorii veroyatnostej. M.: Nauka-Fizmatlit, 2012. 608 s.