Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2014, № 2 (1), с. 190-197
УДК 519.21
СВОЙСТВА ПЕРЕСТАНОВОЧНЫХ И КВАЗИПЕРЕСТАНОВОЧНЫХ СТРАТЕГИЙ УПРАВЛЯЮЩИХ ДИСКРЕТНЫХ СИСТЕМ
© 2014 г. М.А. Федоткин
Нижегородский госуниверситет им. Н.И. Лобачевского [email protected]
Поступила в редакцию 30.12.2013
Построение адекватной вероятностной модели (О, <г, P(•)) для статистически устойчивого эксперимента (управляющей системы) Э удается, как правило, в простых случаях. Для решения этой проблемы для эксперимента Э сложной структуры в [1] предлагается подход, который основан на рассмотрении некоторого параметрического множества и из элементов и и семейства {(О, Pи(•)): и е и} из вероятностных моделей. При этом стоит трудная оптимизационная задача выбора из семейства
{(О, Pи(•)): и е и} по некоторому признаку в одних случаях адекватной модели для эксперимента
Э, а в других случаях - его целевой модели [2-4]. В данной работе с использованием обозначений и результатов из [1] эта задача рассматривается в классе перестановочных и квазиперестановочных стратегий.
Ключевые слова: управляющая система, вероятностная модель, перестановочные распределения, выборочное пространство, экстремальная функция риска, перестановочная стратегия, квазипереста-
новочная стратегия.
Введение
При проведении реального эксперимента Э можно зафиксировать т числовых значений х\, х2, ..., хт измерителей £л(ю) е N , £2(ю)е N, ..., £т(ю) е N его элементарного исхода {ю}, где т > 2, N = {0, 1, ...}, ю е О. Если х = (хь х2, ..., Хт) и £ = (£1, £2, ..., £т), ТО х е ^ и £(ю): О ^ Nrn . Пусть и = {1, 2, ..., т} и множество
V высказываний или решений V = ^(ю) относительно неизвестного параметра и есть {1, 2, ..., т}. Здесь ^(ю): О ^V является математической моделью решения относительно истинного значения неизвестного параметра и. Напомним из [1], что семейство {ри(х) = Ги({ю: £(ю) = х}): х е е Nrn } задает распределение вероятностей для вектора £ на пространстве Nrn при фиксированном значении параметра и е и. Аналогично [1] семейство {^и^; х) = Ги({ю: ^(ю) = v}|{ю: £(ю) = х}): V е V} определяет условное распределение для высказывания ^(ю) на пространстве
V при любых фиксированных значениях и е и и х е Nrn . Класс всех рандомизированных стратегий [1] или решающих функций 5 = gu(v; х): и х V х Nrn ^ [0, 1] будем обозначать через 5”. Стратегию вида 5 = g(v; х) назовем стационарной, если она не зависит от и. Множество стационарных стратегий обозначим через 5С. Равенства ?„({ю: £(ю) = х, ^(ю) = v})= ри(х^и^; х),
u е U, x е Nm , v е V, определяют распределение случайного элемента (£(ю), С(®)) на множестве Nm х V из элементов y = (xi, x2, ..., xm, v). В [1] при фиксированной стратегии 5 е S наряду с
вектором (^1 , £2, ..., £m, С) на (Q, <^, Pu(0) рассматривается случайный вектор (у1, у2, ..., ym, у) на выборочном вероятностном пространстве
вида (Nm х V, 2Nm х V, Pu, ¿(-)), где у1(у) = Х1, у2(у) = = Х2, ..., Jm(y) = Xm, у(у) = V и Pu, *({(x, v)}) = = pu(x)gu(v; x). Так как U = V, то естественно принять, что функция потерь l(u, v) равна нулю, если и ф v, и равна единице при u = v. Отсюда множество Z всех потерь или затрат z от возможных решений v равно {0, 1}. При этом функция риска H(u,s) = Mu,*(l(u,y)) = 1 - Pu, *({y: y(y) = u}) определяет вероятность ошибочного выбора адекватной или целевой модели из класса {(Q, &, Pu(0): u е U}. Если экстремальная [1] функция риска H(s) = max{H(u,5): uеU}= = max {Pu 5 ({y: y(y) ф u}): u е U} при 5 е S, то
функцию Ho(S)=inf{max{Pu, ¿({y: y(y) ф u}): ug е U}: 5 е S} назовем минимаксным значением функции риска относительно класса S. Тогда требуется решить проблему существования и построения минимаксной относительно класса S стратегии 5+ е S, которая удовлетворяет функциональному уравнению оптимальности вида max{P ^+ ({y: у(y) фu}):u eU} =
= inf{max{P„, s({y: y(v) ф u}): u є U}: s є S}.
Выделенная из класса {(Q, &, Pa(0): u є U} модель с помощью построенной стратегии s+ = gu(v; x) объявляется адекватной или целевой.
Класс перестановочных и квазиперестановочных стратегий
Как и в работе [1], обозначим символом П множество всех взаимно-однозначных отображений тс(/): {1, 2, ..., m} ^ {1, 2, ..., m}.
Определение 1. Будем называть стратегию s= = gu(v; x) є S перестановочной, если для любого параметра u є U, решения v є V, отображения тс(-) є П и любого x є Nm имеет место равенство
gu(V; xл(1), ., xn(m)) = gv(u)(n(v); x1, x2, ., xm).
Множество всех перестановочных стратегий обозначим символом S0.
Определение 2. Назовём стратегию s = gu(v; x) є S квазиперестановочной, если для любого параметра u є U, решения v є V, отображения tcQ є П и любого x є Nm имеет место равенство
gu(V; xл(1), ., x^(m)) = &0(v); X1, X2, ., xm).
Множество всех квазиперестановочных стратегий обозначим символом S1. Заметим, что стационарная квазиперестановочная стратегия будет стационарной перестановочной стратегией и, наоборот, стационарная перестановочная стратегия будет стационарной квазиперестано-вочной стратегией. В случае стационарной стратегии определение 1 и определение 2 будут эквивалентными. Более того, если стратегия является одновременно перестановочной и ква-зиперестановочной, то она является стационарной. Множество перестановочных и одновременно квазиперестановочных стратегий естественно обозначить через S0 П S1.
Лемма 1. Если стратегия s = gu(v; x) є S1 и
m
функция g(v; x) = m- S gu (v; x) при любых v=
u=1
= 1, 2, ..., m и x є Nm, то определяемая этим равенством функция g(v; x) является стационарной перестановочной стратегией.
Доказательство. Из формулы для g(v; x) выводим, что функция g(v; x) > 0 и
m
S g (v; ^ X2,..., xm ) =
v=1
m m
= S m - S gu (v; x1> x2’...’ xn ) =
v=1 u=1
m m
= m 1 SS gu (v; X1, X2,..., xm ) = 1.
u=1 v=1
Значит, функция g(v; x) будет стационарной стратегией из S. Установим, что эта стратегия является перестановочной. Принимая во внима-
ние определение 1, необходимо для любых
V е V, %(т) е П и набора х е Nrn доказать, что справедливо соотношение g(v; хп^), х^2), ...,
хП(т)) = g(^(v); х1, х2, ., хт). Для функции g(v; х) имеем
.^(^ ., хп(т)) =
т
= т ^^; xл(1), xл(2), ., хл(т)),>
и=1
g(я(v); х1, х2, ..., хт) =
т
= т- 2 gu(л(v);х1,х2, ...,хт).
и=1
Правые части последних равенств из определения квазиперестановочной стратегии совпадают. Поэтому g(v; хп(1), хп(2), ., хп(т)) = g(л(v); х1, х2, ., хт), и, следовательно, функция g(v; х) является стационарной перестановочной стратегией из класса 50 П 51. Лемма 1 доказана.
Итак, из квазиперестановочной стратегии всегда можно построить перестановочную стратегию, которая не зависит от значения и неизвестного параметра.
Лемма 2. Пусть стратегия 5 = gu(v; х) е 5 и П(£, у) есть класс таких взаимно однозначных отображений а(/) множества {1, 2, ..., т} на себя, что а(к) = j при фиксированных значениях k, j е {1, 2, ..., т}. Тогда при любых и, V = 1, 2, ., т и хе Nrn , тс(-) е П функция gu, o(v; х1, х2, ..., хт) =
т
= (т!)-2 2 gu (k; ха(1), ха(2) ^.^ ха(т)) (1)
k=1 а(/) е П(^,у)
является стратегией, для которой имеет место равенство gu,o(n(v); х^-.-хт) = gu, 0^; хп(1), хП(2),
., хп(т)).
Доказательство. Очевидно, что П(^,у) П П П(k2, У) = Щк,у) П П(k, у 2) = 0, если только ^ ф k2 и j1 ф j2. Разобьём П на классы П(^ у), k,
т
у е {1, 2, ..., т}, так, что П = ^П(k,у) =
k=1
т
= ^ П(k, у). Так как множество П содержит т!
у=1
отображений тс(г'): {1, 2, ..., т} ^ {1, 2, ..., т}, то из определения функции gu, 0(v; х) найдем:
gu, o(v; х1, х2, ..., хт) > 0,
т
2 £и,0(^ х1. х2..... хт ) =
V=1
т т
= 2 (т!) -1 2 2 gu (k; ха(1), ха( 2),..., ха(т)) =
V=1 k=1 а(/) еП(k,у)
т т
= (т!)-12 2 2gu (k; ха(1), ха( 2),..., ха(т)) =
\ ’ а(1
k=1 v=1 a(i) єП(k,v)
= (т!)-1 2 2 gu (^ Х^(1), Х.(2),..., Хтс(т)) =
k=1 тс (г) еП
т
= (т!)-1 2 2 gu (k; ^(ГР Хл(2),..., х,(т)) = 1.
тс(г') еП k =1
Следовательно, функция gu, 0(v; х1, х2, ..., хт) является стратегией из 5. Обозначим через П(^ тс(у)) класс таких взаимно однозначных отображений Р(/) множества {1, 2, ..., т} на себя, что Р(^) = я(у) при любых фиксированных k, V е {1, 2, ., т} и %(г) е П. Из определения П(^ я(у)) и стратегии gu, 0(v; х) получим соотношения: gu, 0^); хЬ х2, ..., хт) =
т
= (т!)-1 2 2 gu (^ хР(1) , ХP(2),..., хр(т) ),
k=1 Р(/) е П^,я(г))
0(V; xл(1), xл(2), ., хл(т)) =
т
= (т!) -12 2 gu (k; Хтс(а(1)), Хтс(а(2)),...,Хтс(а(т)) ) .
k=1 а(г) е П(^,у)
Так как а(к) = V и Р(^) = я(у), то тс(а(^)) = = тс(у) = Р(^). Поэтому формулы для функций
& 0(тс(У); ХЬ x2, •••, хт) и gu, 0(v;xл(1), xл(2), •••, хтс(т))
совпадают. Итак, стратегия gu, 0^; х1, х2, ..., хт) является квазиперестановочной. Лемма 2 доказана.
Следствие 1. Если 5 = gu(v; х) е 5, стратегия gu, 0(у; х1, х2, ., хт) определяется соотношением (1) и функция
т
gu, 1^; Х1, Х2, ..., Хт) = т-2 gl,o(v; Х1, х2,..., Хт)
I=1
при любых и, V = 1, 2, ..., т и (х1, х2, ..., хт) е е Nm , то определяемая этим равенством функция gu, ^; х1, х2, ..., хт) является стационарной перестановочной стратегией.
Свойства перестановочных и квазиперестановочных стратегий
Теорема 1. Пусть стратегия 5 = gu(v; х) является перестановочной. Тогда вероятность Ри,5({у: у(у) = и}) выбора верного значения и неизвестного параметра не зависит от и и Ри, 5({у: у(у) =
V}) = (т - 1)-1тах{Ри, *({у: у(у) ф и}): и е и} при
V ф и.
Доказательство. Рассмотрим отображение %(г) е П, для которого тс(и) = 1, тс(1) = и, %(г) = г при г ф 1, и. Используя сначала формулу Ри, 5({(х1, x2, ., xm, V)}) = Ри(х1, Х2, ..., Хm)gu(v; х), затем определение компонент вектора (у1, у2, •••, Ут, у)
на пространстве (Х х V, Ж ® ^, Ри, 5(-)), равенство и = тс(1), определение 1, определение 2 и, наконец, соотношение г = %(г) при г ф 1, и, последовательно находим:
Ри, *({у = (Х1, Х2, ., Хт, V): у(у) = и }) =
= 2 Ри(Х1, Х2, ., Хт^и(и; Х1, Х2, ., Хт) =
(x1,x2,...,хт )еNm
= 2 Ртс(1)(Х1, Х2, ..., Хт)х
(x1,x2,...,хт )еNm
^(1)(ТС(1);ХЬ Х2, ..., Хт ) =
= 2 p1(xтс(1), xл(2), ., xл(u), ., хтс(т)) Х
(x1,x2,...,хт )еNm
Х5"1(1; xтс(1), xл(2), •••, -^(и):; •••, хтс(т)) =
= 2 p1(xтс(1), •••, -^(и):; •••, хт) Х
(x1,x2,...,хт )еNm
Х«§1(1; Хтс(1), x2, ., -^(и):; ., хт) =
= 2 Р1(Х1, Х2, ..., Хт) X
(x1,x2,...,хт )еNm
Xgl(1; Х1, Х2, ..., Хт) = = Р1, *({.У = (Х1, Х2, ., Хт, V): у(у) = 1 }), и е {1, 2, ..., т}.
Первая часть теоремы доказана. Отсюда следует, что функция риска
Н(и, 5) = Ри, *({у: у (у) ф и}) = 1 - Ри, *({у: у(у)= = и}) = = 1 - р1, 5({У: у(у) = 1}) = р1, 5({У: у(у) ф 1})=
= Н(1, 5)
для каждого и е {1, 2, ..., т} и также не зависит от параметра и. Поэтому экстремальная функция риска Н(5) = тах{Н(и, 5): и е и} также равна Н(1, 5).
Для завершения доказательства теоремы 1 воспользуемся взаимно-однозначным отображением %(г) множества {1, 2, ., т} на себя, для которого %(к) = у, %(у) = k, k фу, и ф k, и фу и тс(г)= = г при г ф k,у. Здесь либо k <у, либо k >у. Пусть для определенности у' > k. По аналогии с рассуждениями первой части леммы, учитывая только теперь равенство и = тс(и) при и ф k, у и k = =
тс(/), получим:
Ри, *({у = (Х1, Х2, ., Хт, V): у(у) = k}) =
= 2 Ри(Х1, Х2, ..., Хт) X
(x1,x2,...,хт )еNm
Xgu(k; Х1, Х2, ..., Хт ) =
= 2 Ртс(и)(Х1, Х2, ..., Хт) X
(x1,x2,...,хт )еNm
Xgя(и)(л(/); Х1, Х2, ..., Хт ) =
= 2 pu(xтс(1), xл(2), • • •,
(x1,x2,...,хт )еNm
xл(k), ., xл(^), ., Хтс(т)) х
х gu(7'; •••, •••, ., хтс(т)) =
= 2 ри(х1, x2, ., xл(k), ., xл(7'), ., хт) х
(x1,x2,...,хт )еNm
х ^{]; ХЬ x2, ., xл(k), ., xл(7'), ., хт) =
= 2 Ри(Х1, Х2, ., Хm)gu(7'; Х1, Х2, ., Хт) =
(x1,x2,...,хт )еNm
= Ри, *({у = (Х1, Х2, ., Хт, V): у(у) = у}). Аналогично доказывается равенство Ри, 5({у: у(у) = k}) = Ри, *({у: у(у) = у}) при k >у. Так как
т
2 Ри, *({у: у(у) = k}) = 1, то при V ф и имеет
k=1
место равенство (т - 1) х Ри, 5({у: у(у) = V}) + + Ри, *({у: у(у) = и}). Отсюда вероятность Ри, *({у: у(у) = = (т - 1)-1(1 - Ри, 5({У: у(у) = м})) =
= (т - 1)-1тах{Ри, *({у: у(у) ф м}): и е и}.
Замечание 1. Содержание и доказательства лемм 1, 2 и теоремы 1 показывают, что перестановочные и квазиперестановочные стратегии образуют разные множества 50 и 51.
Теорема 2. Пусть стратегия 5 = gu(v; х) е 51. Тогда существует такая стратегия h = g(v^; х) е 5С, для которой Н(5) > H(h).
Доказательство. Для квазиперестановочной стратегии 5 = gu(v; х), используя формулу Ри- 5({(х1, x2, ., xm, V)}) = Ри(х^и^; х), при и е {1, 2, ., т} имеем:
Ри, 5({У: у(у) = и}) =
= 2 Ри(Х1, Х2, ..., Хm)x
(x1,x2,...,хт )еNm
Xgu(u; Х1, Х2, ..., Хт ). (2)
Обозначим через q такое значение неизвестного параметра, для которого
Рч, 5({у: у(у) = q}) =
= тах{Ри,*({у: у(у) = м}): и е и}. (3)
Пусть %(г) е П определяется соотношениями: %(и) = 1, тс(1) = и, %(г) = г при г ф 1, и. Для стратегии h = g(v; х) = gq(v; х) е 5С, учитывая условие теоремы и определение 3, при каждом фиксированном и е и получаем, что
Ри, ^{у = (Х1, Х2, ., Хт, V): у(у) = и}) =
= 2 Ри(Х1, Х2, ..., Хт) X
(x1,x2,...,хт )еNm
Xg(м; Х1, Х2, ..., Хт ) =
= 2 Ртс(1)(Х1, Х2, ..., Хт) X
(x1,x2,...,хт )е^
Xg(тс(1); Х1, Х2, ..., Хт ) =
= 2 p1(xтс(1), xл(2), ., xл(u), ., хтс(т)) X
(x1,x2,...,хт )е^
><5'(1; Хтс(1), xл(2), ., xл(u), ., хтс(т)) =
= 2 p1(xтс(1), x2, •••, -^(и):; •••, хт) X
(x1,x2,...,хт )еNm
><5'(1; Хтс(1), x2, •••, -^(и):; •••, хт) =
= 2 Р1(Х1, Х2, ..., Хт) X
(x1,x2,...,хт )е^
Xg(1; Х1, Х2, ..., Хт) =
= Р1, h({y = (Х1, Х2, ., Хт, V): у(у) = 1}), и е {1, 2, ..., т}.
Отсюда следует, что вероятность Ри^({у = (х1, х2, ..., хт, V): у(у) = и}) не зависит от и. Из (2)
при и = q в силу выбора стратегии h = g(v; х) =
=gq(v; х) легко установим, что Pq, 5({У: у(У) = q}) = 2 Pq(Хl, Х2, ., Хт) X
(x1,x2,...,хт )еNm
xgq(q; Х1, Х2, ..., Хт) =
= Pq, h({y = (Х1, Х2, ., Хт, V): у(у) = q}).
Из (3) находим, что для всех и е и
Рд, и({у = (хі, Х2, ..., хт, V): у(у) = д}) =
= Ри, и([у = (Хі, Х2, ..., Хт, V): у(у) = и}) >
> ри, ,({у: 1(у) = и}).
Поэтому для всех и є и имеем: 1 - РиИ({у: у(у)* Фи})>1-Ри,^({у: у(у)*и}). Следовательно, Ри, Й({у: у(у) * и}) < Ри, *({у: у(у) * и}), тах{Ри, и({у: у(у) * *и}): и є и} < тах{Ри, ¿({у: у(у) * и}): и є є и} и И^) > И(И). Теорема 2 доказана. Используя метод доказательства теоремы 2, легко установить следующее утверждение.
Теорема 3. Если стратегия s = gu(v; х) є 50, то существует независящая от значения и неизвестного параметра стратегия И = g(v; х), для которой И^) > И(И).
Теорема 4. Пусть s = g(v; х) є 50. Тогда существует такая перестановочная стратегия s(0) = g(0)(v; х) є 50, для которой И^) > И(s(0)).
Доказательство. Обозначим через П(к, и) класс таких отображений Р(/') є П, что Р(к) = и при заданных значениях k, и є {1, 2, ..., т}. В силу равенства и = Р(к) и определения 1 получим соотношение Ри(Х1, Х2, ..., Хт) = Pp(k)(Хl, Х2, •••, Хт) = Р*(Хр(1), Хр(2), ..., Хр(т)) при Р(/') є П(k, и). Используя это, для s = g(v; х) выводим X Ри(х1, х2, ..., хт) X
(x1, x2,..., хт )є^т
Xg(k; ХР(1), ХР(2> •••, хР(т)) =
= X РкС^^ ХР(2> •••, хР(т)) Х
(x1, x2,..., хт )є^т
Xg(k; ХР(1), ХР(2), ., хР(т)) = Рк,* ({у : У(у) = к}). (4) Для s = g(v; х) согласно следствию 1 построим перестановочную стратегию So:
s(0) = g(0)(v; х) = gи> l(v; х1, х2, ., хт) =
т
= т^‘ X g,,0(v^; Х1, Х2,..., хт ) =
I = 1
т т _
= т-1 X (т!)-1 X X g^ (к; х“(1) ’ х“(2) ’."’ х“(т) ) =
I =1 к =1 а(/) єП(к,г)
т
= (т!)-1 X X g(к; ха(1), Ха(2),..., ха(т)).
к=1 а(/) є П(к,у)
Для построенной перестановочной стратегии s(0) = g(0\v; х) є 5С с учетом равенства
Ри ,/0)({у: у(у) = и}) =
= X Ри(х1, х2, ., Хm)go(u; х1, х2, ., хт )
(x1,x2,...,хт )є^т
имеем:
т
X ри.(0)({у: у) = и}) =2 X Ри(хь
и=1 иєи (x1, х2^... хт )є^т
х2, ., хт)^'0) (и; х1, х2, ., хт ) =
т
= X X Ри(х1, х2, ., хт)х
и=1 (х1 ,х2,...,хт )єN
т
X (т!)-1 X X g(к; хР(1) , ХР(2),..., хР(т)) =
к=1 Р(/) єП(к,и)
= (т!)-12 2 2 2Ри Х2 ,..., Хт ) х
и=1 k=1 Р(1) еП(k,и)(х1,Х2,...,хт )еNm х ё (k; ХР(Гр ХP(2),..., ХР( т) ).
Отсюда, используя соотношение (4), последовательно выводим:
т
2 Р ,5(0)({у: у( у)=и}) =
и=1
т т
= (т!)-12 2 2 2Ри (Х1, Х2 ^.^ Хт ) х
и=1 k=1 Р(1) еП ( k ,и)( х1, Х2,..., хт )еNm
х ё (k; ХР(1), ХР(2),..., ХР( т) ) = т т
= (т!)-122 2Р*5 ({У: у(у) = ^) =
и=1 k=1 Р(г) е П(к,и) т
=(т!)-12 2Р^({у: у(у)=к})=
k=1 тс(г') еП т
= (т!)-1 2 2 Р^ ({у: у(у)=k}) =
тс(г') е П k=1 т
= 2 Р^ ,5 ({у: у( у) = k}). (5)
k=1
В силу теоремы 1 при каждом и = 1, 2, ., т выполняется соотношение Р (0)({у: у(у) = и}) =
= Р /°>({у : у(у) = “}), и поэтому имеет место
равенство вида Н(5(0)) = тах{(1 - Р (0)({у:
у(у) = и})): и е и} = 1 - Ри,5(0)({у : у(у) = и}).
Используя это и равенство (5), получим
Ри,5(0)({у: у(у) = и}) > min{pk, 5({у: у(у) = k}):
k = 1, 2, ..., т}. Так как выполняются равенства тт{Р^ *({у: у(у) = k}): k = 1, 2, ..., т} = тт{(1-
- Рк,*({у: у(у) ф k})): k = 1, 2, ..., т} = 1 -
- тах{Рк,*({у: у(у) ф к}): k = 1, 2, ..., т} = 1 -
- H(5), то Ри ,5(0)({у: у( у) = и}) = 1 - н(5(0)) > 1 -
- Н(5), или Н(5) > Н(5(0)). Теорема 4 доказана. Из этих теорем можно сделать два практических вывода.
Во-первых, вместо класса 5 всех стратегий целесообразно использовать более узкий класс 5' = 50 и 51 и 5С. В связи с этим величину Н0( 5') = inf{H(5): 5 е 5' } назовем минимаксным значением функции риска Н(и, 5) относительно класса 5'. Заметим, что элементами класса 5' являются как нестационарные перестановочные стратегии, так и нестационарные квазиперестановочные стратегии.
Во-вторых, минимаксные стратегии относительно класса 5' следует искать среди всех перестановочных и одновременно квазипереста-новочных стратегий, которые не зависят от неизвестного параметра и.
Экстремальная функция риска для перестановочных и квазиперестановочных стратегий
Рассмотрим вектор х = (х1, х2, ., хт) е Nm , который содержит е = е(х) различных компонент. Ради определенности допустим, что значения Ь(1) = Ь(1; х), Ь(2) = Ь(2; х), ., Ь(е) = Ь(е; х) этих компонент удовлетворяют условию Ь(1) < < Ь(2) < ... < Ь(е). При этом число компонент вектора х = (х1, х2, ..., хт), каждая из которых принимает значение Ь(у), равно с(у) = с(у, х), где у = 1, 2, ..., е. Ясно, что имеет место равенство с(1) + с(2) + ... + с(е) = т. Набор номеров для компонент вектора х = (х1, х2, ., хт), каждая из которых принимает значение Ь(у), обозначим через а(у,1), а(у,2), ..., а(у,с(у)). Итак,
Ха(уЛ) = Ха(у 2) = . = ха(/> у = Ь(/). Не ограничивая общности, в дальнейшем будем считать, что
a(у, 1) < a(у, 2) < •••< a(у, с(у)).
При k = 1, 2, ., т и у = 1, 2, ., е обозначим через Wk, у(х) множество всех различных векторов, каждый из которых получается с помощью перестановок компонент заданного вектора х = = (х1, х2, ., хт). При этом любой вектор множества Wk, у(х) имеет компоненту с номером к, значение которой равно Ь(у). Например, если
^ ^..^ Хт ) е Wk, у(х) и (ХГ, Х2', ..., Хт ) е Wk, /(Х),
то х’к = х'1 = Ь(у). Для перестановочного [1] распределения {Ри(Х1, Х2, ..., Хт): (Х1, Х2, ..., Хт) е е Nrn } случайного вектора (£1, £2, ..., £т) докажем следующее свойство.
Лемма 3. Если семейство {{ри(х1, х2, ..., хт): (х1, х2, ..., хт) е Nrn }: и е и} распределений вектора (£1, £2, ..., £т) является перестановочным, то для каждой пары векторов (х[, х'2,
..., xk-1, ЮХ Хк + 1,..., Хт ) , (х1' ^ ..., xk'-l, Ь(уX
Х;+1,...,хт) из множества Wк,у(х) выполняются соотношения
Рк(x;, .4..., хк^ кл хк+^..., хт) =
= Рк (x'l', А,..., xk-l, КЛ xk'+l,..., О (5)
Доказательство. Так как вектор (х[,
Х2,..., Хk-1, ЮХ Хк + 1,..., Хт ) е Iх) и вектор
(х" х" ..., КЛ xk'+l, ..., хт ) е Wk, у(х), то все-
гда существует такое отображение Р(-) е П, которое переводит вектор вида (х[, х'2,...,
Хk-1, ЮХ Хк + 1,..., Хт ) в вектор (xР(1), ХР(2) , ...,
1 7 1 1 \ _ / 11 11 11
ХР( к-1), Ьу , ХР(к+1),..., ХР(т)) = (Х1, Х2 , ..., Хк-1,
Ь(у), хк'+1,..., х'П ), если Р(к) = к. Учитывая равенство к = Р(к), определение 1 и свойства отображения Р(-) е П, последовательно получаем, что
рк (x;, x;,..., хк _l, юх хк+^..., хт) =
= РР(к )(xí, ■х^.- хкнух хк+l,..., хт) =
= рк (ХР(1), ХР(2), ..., ХР( к-1), Ь(у), ХР( к+1), ..., ХР( т)) =
/ 11 11 11 7 / 11 11 \
= Рк (Х1, Х2 , ..., Хk-1, Ь(у ), Хk+1, ..., Хт ) .
Так как равенство (5) имеет место для любой пары векторов из множества Wk у(х), то далее будем обозначать вероятности вида
Рк(x;, x;,..., хк-l, юх хк+l,..., хт),
/ 11 11 11 7 / 11 11 \
Рк (Хl, Х2 ,..., Хk-1, Ь(у ), Хk+1,..., Хт ) через функцию Рк^к, у(х)). Лемма 3 доказана.
Лемма 4. Пусть стратегия 5 = ёи(у; х) является перестановочной. Тогда для каждой пары
векторов ^ ^^.^ xk-l, Ьу , хк + 1,..., Хт ), (хГ,
х'2,..., хк'-1, Ьу, х'к+1,..., х"т) из множества Wk у(х) выполняются соотношения
ёк (к; ^^.^ xk-l, Ьу , Хк + l,..., хт ) =
= ёк(к; x'l', х2 ,..., хк'-1, ьу, хк'+1,..., хП). (6)
Доказательство. Вектор ( х', х'2,...,
xk-l,ь(у),хк+l,...,хт)^ку^ и вектор (хг,
x2',..., xk'-l, ка xk'+l,..., хт ) е Wkу(x). Поэтому
существует такое отображение Р(-) е П, которое переводит вектор (х', х2,..., хк-Г,
кл-,хк+l,...,хт) в вектор вида (xР(l),хР(2),..., ХР(к-1) , Ку'Х ХР(k+1),..., ХР(т)) = (х1' Х2',..., Хк'-1 , Ьу ,
хк+',..., х^), если только Р(к) = к. Учитывая равенство к = Р(к), определение 2 и свойства отображения Р(-) е П, для перестановочной стратегии 5 = ёк(у; х) находим:
ёРдаФМ; ^ x2,..., xk-l, КЛ хк+l,..., хт) =
= gk(v; ХР(1), ХР(2), ..., ХР(к-1), Ь(у), ХР(к+1), ..., ХР(т) ).
Левая часть последнего соотношения при Р(к) = =к и v=k равна выражению ёк(к; х', Х2,..., хк-Г,Ь(у),х’к+',...,х'т ), а правая часть с учетом равенств v = к и (ХР(1), ХР(2),..., хР(к-1),НА 1 1 \ / 11 11 11 7 / 11 11\ Хp(k+1),..., ХР(т)) = ^ Х2 ,..., Хk-1, b(У), Хk+1,..., Хт )
приводится к виду ёк (к; х" х"..., хк-', Ь(у), хк+',..., х^). Отсюда непосредственно получаем соотношение (6) для любой пары векторов
(х'\х^ ...,xk-l,НуХ xk+l,...,хт), (х1' x2',...,хк-1,
Ь(у),хк'+',...,хП)из множества Wkу(x). Поэтому вероятности вида ёк (к; х', х^,..., х'к-Г, Ьу,
Г Г \ /~1 >> >> >> 1 >>
Хk + 1,..., Хт ) и ёк (к; Х1, Х2 , ..., Хk-1, Ьу , Хk+1,...,
х'т) естественно обозначить ниже через функцию ёк(к; Wk у(х)). Утверждение леммы 6 доказано.
Следствие 2. Если решающая функция 5 = ё^; х) является перестановочной и стационарной, то соотношение (6) примет вид
ё(к; xll, -4..., хк-', НуХ хк+l,..., хт) =
= ё(к;х'' x2,..., xil, Ь(Л xk'+l,..., х'т) =
=ё(к; Wk у(х)). (7)
Используя методику доказательства леммы 4 и определение 2, легко установить, что для стратегии 5 = ёи^; х) е справедливы соотношения (6) и (7).
Теорема 5. Пусть стратегия 5 = ё(у; х) является квазиперестановочной и стационарной. Тогда для любого вектора х е Nm выполняются соотношения
2с(у)ё(к;^,у(х))=' к=1,2,...,т. (8)
у=1
Доказательство. При любом фиксированном к = 1, 2, ., т из соотношения (7) при любом фиксированном г е {1, 2, ..., с(у)} имеем:
ё(к; ^, у(х)) =
= ё(к; xl, x2,..., Ха( у, ^ хк ,
Ха(у, 1)+1, ..., Хк - 1, Ха(у,г), Хк + 1, ..., Хт )
при а(у, г) < к;
ё(к; Wk, у(х)) =
= ё (к; xl, x2,..., хк - ', Ха( у,,■), хк + l,...,
Ха(у,г)-1 , Хк , Ха(у, ;)+1, ..., Хт )
при а(у, г) > к;
ё(к; Wk, у(х)) =
= ё(к; xl, x2, ..., хк-', Ха(у,г^ хк + 1,..., Хт) (11)
при а(у, г) = к.
Так как стратегия 5 = ё(у; х) является перестановочной, то отображение а(-) е П, а(и) = и при и ф к, и ф а(у, г), а(к) = а(у, г), а(а(у, г)) = к, позволяет соотношения (9)—(11) записать в виде
ё(к; Wk, у(х)) =
= ё(а(а(у\ г)); Х1, Х2 , ..., Ха(у,,■)-1, Хк ,
Ха(у, 1)+1, ..., Хк - 1, Ха(у,г) , Хк + 1, ..., Хт ) =
= ё (а(у\ г); xl, x2,..., ха(у ,,.)-l, Ха( у,г) ,
Ха( у, ,■)+1,..., Хк - ', Хк , Хк + 1,..., Хт ) =
= ё (а(у\ г); Х1, Х2 , ..., Хк - ', Хк , Хк + 1, ..., Хт ) при а(у, г) < к;
ё(к; Wk, у(х)) =
= ё(а(а^./■, г)); Х2 , ..., Хк - ', Ха(у,{Р
Хк + 1, ..., Ха(у,г)-1 , Хк , Ха(у, 1)+1, ..., Хт ) =
= ё(а(у\г); xl, x2,..., хк-', хк, (13)
(13)
Хк + 1, ..., Ха(у, 1)-1, Ха(у,г) , Ха(у,г)+1, .", Хт ) =
= ё (а(у\ г); Х1, Х2 , ..., Хк - ', Хк , Хк + 1,..., Хт )
(9)
(10)
(12)
х gk (k; Уl, y2 , ..., ym ) =
e( X)
Ч,
= 2 21 Wk ,j (X1, X2 , ..., Xm )| Х
x1<x2 < - <Xm j=
при a(j, i) > k; e(x)
g(k; Wk, jx)) = =22 2 Pk У У 2 ,..., ym) х
= g (k X X X X X X ) = x1< x2 < - < xm j=1 (У1, У2,..., ym )eWk, j(x)
gyii, Л-1, A-2,..., л-k-^ a( j ,i)’ "4 +1> •••> m / _
= g(k- X X X X X X ) = (14) Х gk (k; У1, У2,..., ym).
-4— 1? Xa(j,i)’ Xk + 15-"J m / TT , ,,
= Используя функции Pk(Wk,j(x)), gk(k; Wk, jx)),
= g(k; x1, x2,. ., xk-1, xk, xk+1,. ., Xm) которые были введены для равенств (5), (6), и
при a(j, i) = k. соотношение | Wk, ;(x)| х m = | W(x)| х c(j) , из (16)
Из (12)—( 14) получаем, что при j = 1, 2, ..., e легко найдем:
имеет место равенство c(j)g(k;Wkj(x)) = Pk, ¿({y: y(y) = k}) =
c(j) e(x)
= 2 g(a(j', г); X1, X2, ..., Xm). Суммируя это ра- =2 2 2Pk (У^ Уз — ym ) х
i=1 x1<x2 < ... <xm j=1 (У1,У2 ,..., ym )eWk, j (x)
венство по j и принимая во внимание определение величин e(x), c(j) и a(j, i), непосредственно найдем:
2 c(j)g (k; WkJ (x)) =
х pk (Wk,j (x))gk (k; Wk,j (x)) =
e(x) c(j) 1
= 22 g(a(j^ i)'; X1, X2, ..., Xm) = = — 21 W (X1, X2 , ..., Xm )| х
j=1 i=1 m X1 <x2 < .. <xm
m e( x)
= 2g(v;xl,X2^.^xm) =1 х2c(j)Pk (Wk j (x))gk (k; Wk j (x)).
v=1 j=1
для каждого фиксированного k = 1, 2, ., m. Отсюда и следует соотношение (15), теорема 6
Теорема 5 доказана. доказана.
Обозначим символом W(x) = W(xb X2, ..., Xm) Замечание 2. Применяя метод доказательст-
множество всех различных векторов, каждый из ва теоремы 6 для перестановочной стратегии и
которых получается с помощью перестановок справедливое соотношение (6) для решающей
компонент заданного вектора x = (xb X2, ..., Xm). функции 5 = gu(v; x) из множества S1, легко ус-
Если 1 W(x)| и 1 Wk,;(x)| - число элементов множе- тановить, что для любой квазиперестановочной
ства W(x) и Wk, j(x) соответственно, то |W(x)|= стратегии имеет место соотношение (15).
= m!/((c(1))! х (c(2))! х ... х (c(e))!) и |Wk, jx)| х m =
= |W(x)| х c(j) [5]. Список литературы
Теорема 6. Пусть стратегия 5 = gu(v; x) является перестановочной. Тогда 1 Федоткин МА Задача оптимизации для пере-
тт/ч . /ч 7-»ч становочного семейства вероятностных моделей сис-
H(5) = 1 — Pk s({ y: y(y) = k}) = //T^ TT
4 ' i w j/ Тем с управлением // Вестник Нижегородского уни-
= 1 L 2 lW(x x X )1 х верситета им. Н.И. Лобачевского. 2012. № 5(2).
m^J?<x *’ 2”"’ ' С. 222—227.
X1 <x2 < ... <xm , -х
e(x) (15) 2. Zorine A.V., Fedotkin M.A. Optimization of Con-
х2 c( j) p (W (x))g (k; W (x)) trol of Doubly Stochastic Nonordinary Flows in Time“ k k,j k ’ k,j Sharing Systems // Automation and Remote Control.
Доказательство. Применяя формулу (2) для 2005. Т. 66. № 7. С. 1115—1124.
/ \ v 3. Пройдакова Е.В., Федоткин М.А. Управление
стратегии gu(v;x) е S, определения множеств r г _
выходными потоками в системе с циклическим об-
W(x) и Wk, j■(x), для вероятности Pk, 5({y: y(y) = k}) служиванием и переналадками // Автоматика и теле-
имеем: механика. РАН. 2008. № 6. С. 96—106.
Pk, 5({y: y(y) = k}) = 2 Pk(x1, x2, • ••, Xm)x 4. Федоткин М.А., Федоткин А.М. Анализ и оп-
(xl,x2,...,Xm)eN тимизация выходных процессов при циклическом
xgk(k; x1, x2, ..., xm) = управлении конфликтными транспортными потока-
= 2 2 P (V V V ) х ми Гнеденко—Коваленко // Автоматика и телемеха-
^ <xm (y^^m)*W« m (16) ника. РАН. 2009. № 12. C. 92—108.
5. Федоткин М.А. Модели в теории вероятностей.
х gk( ; y2,..., Ут) = м.: Наука-Физматлит, 2012. 608 с.
PROPERTIES OF PERMUTATION AND QUASI-PERMUTATION STRATEGIES OF DISCRETE CONTROL SYSTEMS
M.A. Fedotkin
As a rule, it is possible to construct an adequate probabilistic model (Q, &, P(-))for a statistically stable experiment (control system) Э only in simple cases. To solve this problem for the experiment Э of a complex structure, an approach has been suggested in [1] which is based on a parametric set U with elements u and a family {(Q, P„Q): u e U} of probabilistic models. A difficult optimization problem arises here: to choose by some criterion from the family {(Q, i, PMQ): u e U} in some cases, an adequate model for the experiment Э, and, in other cases, a target model for this experiment [2-4]. Using notation and results from [1], the article considers the problem for a class of permutation and quasi-permutation strategies.
Keywords: control system, probabilistic model, permutation distributions, sample space, extremal risk function, permutation strategy, quasi-permutation strategy.
References
1. Fedotkin M.A. Zadacha optimizacii dlya peresta-
novochnogo semejstva veroyatnostnyh modelej sistem s upravleniem // Vestnik Nizhegorodskogo universiteta im. N.I. Lobachevskogo. 2012. № 5(2).
S. 222-227.
2. Zorine A.V., Fedotkin M.A. Optimization of Control of Doubly Stochastic Nonordinary Flows in TimeSharing Systems // Automation and Remote Control. 2005. T. 66. № 7. S. 1115-1124.
3. Projdakova E.V., Fedotkin M.A. Upravlenie vy-hodnymi potokami v sisteme s ciklicheskim obsluzhiva-niem i perenaladkami // Avtomatika i telemekhanika. RAN. 2008. № 6. S. 96-106.
4. Fedotkin M.A., Fedotkin A.M. Analiz i op-timizaciya vyhodnyh processov pri ciklicheskom uprav-lenii konfliktnymi transportnymi potokami Gnedenko-Kovalenko // Avtomatika i telemekhanika. RAN. 2009. № 12. S. 92-108.
5. Fedotkin M.A. Modeli v teorii veroyatnostej. M.: Nauka-Fizmatlit, 2012. 608 s.