Научная статья на тему 'Свойства перестановочных и квазиперестановочных стратегий управляющих дискретных систем'

Свойства перестановочных и квазиперестановочных стратегий управляющих дискретных систем Текст научной статьи по специальности «Математика»

CC BY
82
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УПРАВЛЯЮЩАЯ СИСТЕМА / ВЕРОЯТНОСТНАЯ МОДЕЛЬ / ПЕРЕСТАНОВОЧНЫЕ РАСПРЕДЕЛЕНИЯ / ВЫБОРОЧНОЕ ПРОСТРАНСТВО / ЭКСТРЕМАЛЬНАЯ ФУНКЦИЯ РИСКА / ПЕРЕСТАНОВОЧНАЯ СТРАТЕГИЯ / КВАЗИПЕРЕСТАНОВОЧНАЯ СТРАТЕГИЯ

Аннотация научной статьи по математике, автор научной работы — Федоткин М. А.

Построение адекватной вероятностной модели (W, ℱ, P(∙)) для статистически устойчивого эксперимента (управляющей системы) Э удается, как правило, в простых случаях. Для решения этой проблемы для эксперимента Э сложной структуры в [1] предлагается подход, который основан на рассмотрении некоторого параметрического множества U из элементов u и семейства {(W, ℱ, P u (∙)): u Î U } из вероятностных моделей. При этом стоит трудная оптимизационная задача выбора из семейства {(W, ℱ, P u (∙)): u Î U } по некоторому признаку в одних случаях адекватной модели для эксперимента Э, а в других случаях  его целевой модели [24]. В данной работе с использованием обозначений и результатов из [1] эта задача рассматривается в классе перестановочных и квазиперестановочных стратегий.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PROPERTIES OF PERMUTATION AND QUASI-PERMUTATION STRATEGIES OF DISCRETE CONTROL SYSTEMS

As a rule, it is possible to construct an adequate probabilistic model (W, ℱ, P(∙))for a statistically stable experiment (control system) Э only in simple cases. To solve this problem for the experiment Э of a complex structure, an approach has been suggested in [1] which is based on a parametric set U with elements u and a family {(W, ℱ, P u (∙)): u Î U } of probabilistic models. A difficult optimization problem arises here: to choose by some criterion from the family {(W, ℱ, P u (∙)): u Î U } in some cases, an adequate model for the experiment Э, and, in other cases, a target model for this experiment [2-4]. Using notation and results from [1], the article considers the problem for a class of permutation and quasi-permutation strategies.

Текст научной работы на тему «Свойства перестановочных и квазиперестановочных стратегий управляющих дискретных систем»

Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2014, № 2 (1), с. 190-197

УДК 519.21

СВОЙСТВА ПЕРЕСТАНОВОЧНЫХ И КВАЗИПЕРЕСТАНОВОЧНЫХ СТРАТЕГИЙ УПРАВЛЯЮЩИХ ДИСКРЕТНЫХ СИСТЕМ

© 2014 г. М.А. Федоткин

Нижегородский госуниверситет им. Н.И. Лобачевского fma5@rambler.ru

Поступила в редакцию 30.12.2013

Построение адекватной вероятностной модели (О, <г, P(•)) для статистически устойчивого эксперимента (управляющей системы) Э удается, как правило, в простых случаях. Для решения этой проблемы для эксперимента Э сложной структуры в [1] предлагается подход, который основан на рассмотрении некоторого параметрического множества и из элементов и и семейства {(О, Pи(•)): и е и} из вероятностных моделей. При этом стоит трудная оптимизационная задача выбора из семейства

{(О, Pи(•)): и е и} по некоторому признаку в одних случаях адекватной модели для эксперимента

Э, а в других случаях - его целевой модели [2-4]. В данной работе с использованием обозначений и результатов из [1] эта задача рассматривается в классе перестановочных и квазиперестановочных стратегий.

Ключевые слова: управляющая система, вероятностная модель, перестановочные распределения, выборочное пространство, экстремальная функция риска, перестановочная стратегия, квазипереста-

новочная стратегия.

Введение

При проведении реального эксперимента Э можно зафиксировать т числовых значений х\, х2, ..., хт измерителей £л(ю) е N , £2(ю)е N, ..., £т(ю) е N его элементарного исхода {ю}, где т > 2, N = {0, 1, ...}, ю е О. Если х = (хь х2, ..., Хт) и £ = (£1, £2, ..., £т), ТО х е ^ и £(ю): О ^ Nrn . Пусть и = {1, 2, ..., т} и множество

V высказываний или решений V = ^(ю) относительно неизвестного параметра и есть {1, 2, ..., т}. Здесь ^(ю): О ^V является математической моделью решения относительно истинного значения неизвестного параметра и. Напомним из [1], что семейство {ри(х) = Ги({ю: £(ю) = х}): х е е Nrn } задает распределение вероятностей для вектора £ на пространстве Nrn при фиксированном значении параметра и е и. Аналогично [1] семейство {^и^; х) = Ги({ю: ^(ю) = v}|{ю: £(ю) = х}): V е V} определяет условное распределение для высказывания ^(ю) на пространстве

V при любых фиксированных значениях и е и и х е Nrn . Класс всех рандомизированных стратегий [1] или решающих функций 5 = gu(v; х): и х V х Nrn ^ [0, 1] будем обозначать через 5”. Стратегию вида 5 = g(v; х) назовем стационарной, если она не зависит от и. Множество стационарных стратегий обозначим через 5С. Равенства ?„({ю: £(ю) = х, ^(ю) = v})= ри(х^и^; х),

u е U, x е Nm , v е V, определяют распределение случайного элемента (£(ю), С(®)) на множестве Nm х V из элементов y = (xi, x2, ..., xm, v). В [1] при фиксированной стратегии 5 е S наряду с

вектором (^1 , £2, ..., £m, С) на (Q, <^, Pu(0) рассматривается случайный вектор (у1, у2, ..., ym, у) на выборочном вероятностном пространстве

вида (Nm х V, 2Nm х V, Pu, ¿(-)), где у1(у) = Х1, у2(у) = = Х2, ..., Jm(y) = Xm, у(у) = V и Pu, *({(x, v)}) = = pu(x)gu(v; x). Так как U = V, то естественно принять, что функция потерь l(u, v) равна нулю, если и ф v, и равна единице при u = v. Отсюда множество Z всех потерь или затрат z от возможных решений v равно {0, 1}. При этом функция риска H(u,s) = Mu,*(l(u,y)) = 1 - Pu, *({y: y(y) = u}) определяет вероятность ошибочного выбора адекватной или целевой модели из класса {(Q, &, Pu(0): u е U}. Если экстремальная [1] функция риска H(s) = max{H(u,5): uеU}= = max {Pu 5 ({y: y(y) ф u}): u е U} при 5 е S, то

функцию Ho(S)=inf{max{Pu, ¿({y: y(y) ф u}): ug е U}: 5 е S} назовем минимаксным значением функции риска относительно класса S. Тогда требуется решить проблему существования и построения минимаксной относительно класса S стратегии 5+ е S, которая удовлетворяет функциональному уравнению оптимальности вида max{P ^+ ({y: у(y) фu}):u eU} =

= inf{max{P„, s({y: y(v) ф u}): u є U}: s є S}.

Выделенная из класса {(Q, &, Pa(0): u є U} модель с помощью построенной стратегии s+ = gu(v; x) объявляется адекватной или целевой.

Класс перестановочных и квазиперестановочных стратегий

Как и в работе [1], обозначим символом П множество всех взаимно-однозначных отображений тс(/): {1, 2, ..., m} ^ {1, 2, ..., m}.

Определение 1. Будем называть стратегию s= = gu(v; x) є S перестановочной, если для любого параметра u є U, решения v є V, отображения тс(-) є П и любого x є Nm имеет место равенство

gu(V; xл(1), ., xn(m)) = gv(u)(n(v); x1, x2, ., xm).

Множество всех перестановочных стратегий обозначим символом S0.

Определение 2. Назовём стратегию s = gu(v; x) є S квазиперестановочной, если для любого параметра u є U, решения v є V, отображения tcQ є П и любого x є Nm имеет место равенство

gu(V; xл(1), ., x^(m)) = &0(v); X1, X2, ., xm).

Множество всех квазиперестановочных стратегий обозначим символом S1. Заметим, что стационарная квазиперестановочная стратегия будет стационарной перестановочной стратегией и, наоборот, стационарная перестановочная стратегия будет стационарной квазиперестано-вочной стратегией. В случае стационарной стратегии определение 1 и определение 2 будут эквивалентными. Более того, если стратегия является одновременно перестановочной и ква-зиперестановочной, то она является стационарной. Множество перестановочных и одновременно квазиперестановочных стратегий естественно обозначить через S0 П S1.

Лемма 1. Если стратегия s = gu(v; x) є S1 и

m

функция g(v; x) = m- S gu (v; x) при любых v=

u=1

= 1, 2, ..., m и x є Nm, то определяемая этим равенством функция g(v; x) является стационарной перестановочной стратегией.

Доказательство. Из формулы для g(v; x) выводим, что функция g(v; x) > 0 и

m

S g (v; ^ X2,..., xm ) =

v=1

m m

= S m - S gu (v; x1> x2’...’ xn ) =

v=1 u=1

m m

= m 1 SS gu (v; X1, X2,..., xm ) = 1.

u=1 v=1

Значит, функция g(v; x) будет стационарной стратегией из S. Установим, что эта стратегия является перестановочной. Принимая во внима-

ние определение 1, необходимо для любых

V е V, %(т) е П и набора х е Nrn доказать, что справедливо соотношение g(v; хп^), х^2), ...,

хП(т)) = g(^(v); х1, х2, ., хт). Для функции g(v; х) имеем

.^(^ ., хп(т)) =

т

= т ^^; xл(1), xл(2), ., хл(т)),>

и=1

g(я(v); х1, х2, ..., хт) =

т

= т- 2 gu(л(v);х1,х2, ...,хт).

и=1

Правые части последних равенств из определения квазиперестановочной стратегии совпадают. Поэтому g(v; хп(1), хп(2), ., хп(т)) = g(л(v); х1, х2, ., хт), и, следовательно, функция g(v; х) является стационарной перестановочной стратегией из класса 50 П 51. Лемма 1 доказана.

Итак, из квазиперестановочной стратегии всегда можно построить перестановочную стратегию, которая не зависит от значения и неизвестного параметра.

Лемма 2. Пусть стратегия 5 = gu(v; х) е 5 и П(£, у) есть класс таких взаимно однозначных отображений а(/) множества {1, 2, ..., т} на себя, что а(к) = j при фиксированных значениях k, j е {1, 2, ..., т}. Тогда при любых и, V = 1, 2, ., т и хе Nrn , тс(-) е П функция gu, o(v; х1, х2, ..., хт) =

т

= (т!)-2 2 gu (k; ха(1), ха(2) ^.^ ха(т)) (1)

k=1 а(/) е П(^,у)

является стратегией, для которой имеет место равенство gu,o(n(v); х^-.-хт) = gu, 0^; хп(1), хП(2),

., хп(т)).

Доказательство. Очевидно, что П(^,у) П П П(k2, У) = Щк,у) П П(k, у 2) = 0, если только ^ ф k2 и j1 ф j2. Разобьём П на классы П(^ у), k,

т

у е {1, 2, ..., т}, так, что П = ^П(k,у) =

k=1

т

= ^ П(k, у). Так как множество П содержит т!

у=1

отображений тс(г'): {1, 2, ..., т} ^ {1, 2, ..., т}, то из определения функции gu, 0(v; х) найдем:

gu, o(v; х1, х2, ..., хт) > 0,

т

2 £и,0(^ х1. х2..... хт ) =

V=1

т т

= 2 (т!) -1 2 2 gu (k; ха(1), ха( 2),..., ха(т)) =

V=1 k=1 а(/) еП(k,у)

т т

= (т!)-12 2 2gu (k; ха(1), ха( 2),..., ха(т)) =

\ ’ а(1

k=1 v=1 a(i) єП(k,v)

= (т!)-1 2 2 gu (^ Х^(1), Х.(2),..., Хтс(т)) =

k=1 тс (г) еП

т

= (т!)-1 2 2 gu (k; ^(ГР Хл(2),..., х,(т)) = 1.

тс(г') еП k =1

Следовательно, функция gu, 0(v; х1, х2, ..., хт) является стратегией из 5. Обозначим через П(^ тс(у)) класс таких взаимно однозначных отображений Р(/) множества {1, 2, ..., т} на себя, что Р(^) = я(у) при любых фиксированных k, V е {1, 2, ., т} и %(г) е П. Из определения П(^ я(у)) и стратегии gu, 0(v; х) получим соотношения: gu, 0^); хЬ х2, ..., хт) =

т

= (т!)-1 2 2 gu (^ хР(1) , ХP(2),..., хр(т) ),

k=1 Р(/) е П^,я(г))

0(V; xл(1), xл(2), ., хл(т)) =

т

= (т!) -12 2 gu (k; Хтс(а(1)), Хтс(а(2)),...,Хтс(а(т)) ) .

k=1 а(г) е П(^,у)

Так как а(к) = V и Р(^) = я(у), то тс(а(^)) = = тс(у) = Р(^). Поэтому формулы для функций

& 0(тс(У); ХЬ x2, •••, хт) и gu, 0(v;xл(1), xл(2), •••, хтс(т))

совпадают. Итак, стратегия gu, 0^; х1, х2, ..., хт) является квазиперестановочной. Лемма 2 доказана.

Следствие 1. Если 5 = gu(v; х) е 5, стратегия gu, 0(у; х1, х2, ., хт) определяется соотношением (1) и функция

т

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

gu, 1^; Х1, Х2, ..., Хт) = т-2 gl,o(v; Х1, х2,..., Хт)

I=1

при любых и, V = 1, 2, ..., т и (х1, х2, ..., хт) е е Nm , то определяемая этим равенством функция gu, ^; х1, х2, ..., хт) является стационарной перестановочной стратегией.

Свойства перестановочных и квазиперестановочных стратегий

Теорема 1. Пусть стратегия 5 = gu(v; х) является перестановочной. Тогда вероятность Ри,5({у: у(у) = и}) выбора верного значения и неизвестного параметра не зависит от и и Ри, 5({у: у(у) =

V}) = (т - 1)-1тах{Ри, *({у: у(у) ф и}): и е и} при

V ф и.

Доказательство. Рассмотрим отображение %(г) е П, для которого тс(и) = 1, тс(1) = и, %(г) = г при г ф 1, и. Используя сначала формулу Ри, 5({(х1, x2, ., xm, V)}) = Ри(х1, Х2, ..., Хm)gu(v; х), затем определение компонент вектора (у1, у2, •••, Ут, у)

на пространстве (Х х V, Ж ® ^, Ри, 5(-)), равенство и = тс(1), определение 1, определение 2 и, наконец, соотношение г = %(г) при г ф 1, и, последовательно находим:

Ри, *({у = (Х1, Х2, ., Хт, V): у(у) = и }) =

= 2 Ри(Х1, Х2, ., Хт^и(и; Х1, Х2, ., Хт) =

(x1,x2,...,хт )еNm

= 2 Ртс(1)(Х1, Х2, ..., Хт)х

(x1,x2,...,хт )еNm

^(1)(ТС(1);ХЬ Х2, ..., Хт ) =

= 2 p1(xтс(1), xл(2), ., xл(u), ., хтс(т)) Х

(x1,x2,...,хт )еNm

Х5"1(1; xтс(1), xл(2), •••, -^(и):; •••, хтс(т)) =

= 2 p1(xтс(1), •••, -^(и):; •••, хт) Х

(x1,x2,...,хт )еNm

Х«§1(1; Хтс(1), x2, ., -^(и):; ., хт) =

= 2 Р1(Х1, Х2, ..., Хт) X

(x1,x2,...,хт )еNm

Xgl(1; Х1, Х2, ..., Хт) = = Р1, *({.У = (Х1, Х2, ., Хт, V): у(у) = 1 }), и е {1, 2, ..., т}.

Первая часть теоремы доказана. Отсюда следует, что функция риска

Н(и, 5) = Ри, *({у: у (у) ф и}) = 1 - Ри, *({у: у(у)= = и}) = = 1 - р1, 5({У: у(у) = 1}) = р1, 5({У: у(у) ф 1})=

= Н(1, 5)

для каждого и е {1, 2, ..., т} и также не зависит от параметра и. Поэтому экстремальная функция риска Н(5) = тах{Н(и, 5): и е и} также равна Н(1, 5).

Для завершения доказательства теоремы 1 воспользуемся взаимно-однозначным отображением %(г) множества {1, 2, ., т} на себя, для которого %(к) = у, %(у) = k, k фу, и ф k, и фу и тс(г)= = г при г ф k,у. Здесь либо k <у, либо k >у. Пусть для определенности у' > k. По аналогии с рассуждениями первой части леммы, учитывая только теперь равенство и = тс(и) при и ф k, у и k = =

тс(/), получим:

Ри, *({у = (Х1, Х2, ., Хт, V): у(у) = k}) =

= 2 Ри(Х1, Х2, ..., Хт) X

(x1,x2,...,хт )еNm

Xgu(k; Х1, Х2, ..., Хт ) =

= 2 Ртс(и)(Х1, Х2, ..., Хт) X

(x1,x2,...,хт )еNm

Xgя(и)(л(/); Х1, Х2, ..., Хт ) =

= 2 pu(xтс(1), xл(2), • • •,

(x1,x2,...,хт )еNm

xл(k), ., xл(^), ., Хтс(т)) х

х gu(7'; •••, •••, ., хтс(т)) =

= 2 ри(х1, x2, ., xл(k), ., xл(7'), ., хт) х

(x1,x2,...,хт )еNm

х ^{]; ХЬ x2, ., xл(k), ., xл(7'), ., хт) =

= 2 Ри(Х1, Х2, ., Хm)gu(7'; Х1, Х2, ., Хт) =

(x1,x2,...,хт )еNm

= Ри, *({у = (Х1, Х2, ., Хт, V): у(у) = у}). Аналогично доказывается равенство Ри, 5({у: у(у) = k}) = Ри, *({у: у(у) = у}) при k >у. Так как

т

2 Ри, *({у: у(у) = k}) = 1, то при V ф и имеет

k=1

место равенство (т - 1) х Ри, 5({у: у(у) = V}) + + Ри, *({у: у(у) = и}). Отсюда вероятность Ри, *({у: у(у) = = (т - 1)-1(1 - Ри, 5({У: у(у) = м})) =

= (т - 1)-1тах{Ри, *({у: у(у) ф м}): и е и}.

Замечание 1. Содержание и доказательства лемм 1, 2 и теоремы 1 показывают, что перестановочные и квазиперестановочные стратегии образуют разные множества 50 и 51.

Теорема 2. Пусть стратегия 5 = gu(v; х) е 51. Тогда существует такая стратегия h = g(v^; х) е 5С, для которой Н(5) > H(h).

Доказательство. Для квазиперестановочной стратегии 5 = gu(v; х), используя формулу Ри- 5({(х1, x2, ., xm, V)}) = Ри(х^и^; х), при и е {1, 2, ., т} имеем:

Ри, 5({У: у(у) = и}) =

= 2 Ри(Х1, Х2, ..., Хm)x

(x1,x2,...,хт )еNm

Xgu(u; Х1, Х2, ..., Хт ). (2)

Обозначим через q такое значение неизвестного параметра, для которого

Рч, 5({у: у(у) = q}) =

= тах{Ри,*({у: у(у) = м}): и е и}. (3)

Пусть %(г) е П определяется соотношениями: %(и) = 1, тс(1) = и, %(г) = г при г ф 1, и. Для стратегии h = g(v; х) = gq(v; х) е 5С, учитывая условие теоремы и определение 3, при каждом фиксированном и е и получаем, что

Ри, ^{у = (Х1, Х2, ., Хт, V): у(у) = и}) =

= 2 Ри(Х1, Х2, ..., Хт) X

(x1,x2,...,хт )еNm

Xg(м; Х1, Х2, ..., Хт ) =

= 2 Ртс(1)(Х1, Х2, ..., Хт) X

(x1,x2,...,хт )е^

Xg(тс(1); Х1, Х2, ..., Хт ) =

= 2 p1(xтс(1), xл(2), ., xл(u), ., хтс(т)) X

(x1,x2,...,хт )е^

><5'(1; Хтс(1), xл(2), ., xл(u), ., хтс(т)) =

= 2 p1(xтс(1), x2, •••, -^(и):; •••, хт) X

(x1,x2,...,хт )еNm

><5'(1; Хтс(1), x2, •••, -^(и):; •••, хт) =

= 2 Р1(Х1, Х2, ..., Хт) X

(x1,x2,...,хт )е^

Xg(1; Х1, Х2, ..., Хт) =

= Р1, h({y = (Х1, Х2, ., Хт, V): у(у) = 1}), и е {1, 2, ..., т}.

Отсюда следует, что вероятность Ри^({у = (х1, х2, ..., хт, V): у(у) = и}) не зависит от и. Из (2)

при и = q в силу выбора стратегии h = g(v; х) =

=gq(v; х) легко установим, что Pq, 5({У: у(У) = q}) = 2 Pq(Хl, Х2, ., Хт) X

(x1,x2,...,хт )еNm

xgq(q; Х1, Х2, ..., Хт) =

= Pq, h({y = (Х1, Х2, ., Хт, V): у(у) = q}).

Из (3) находим, что для всех и е и

Рд, и({у = (хі, Х2, ..., хт, V): у(у) = д}) =

= Ри, и([у = (Хі, Х2, ..., Хт, V): у(у) = и}) >

> ри, ,({у: 1(у) = и}).

Поэтому для всех и є и имеем: 1 - РиИ({у: у(у)* Фи})>1-Ри,^({у: у(у)*и}). Следовательно, Ри, Й({у: у(у) * и}) < Ри, *({у: у(у) * и}), тах{Ри, и({у: у(у) * *и}): и є и} < тах{Ри, ¿({у: у(у) * и}): и є є и} и И^) > И(И). Теорема 2 доказана. Используя метод доказательства теоремы 2, легко установить следующее утверждение.

Теорема 3. Если стратегия s = gu(v; х) є 50, то существует независящая от значения и неизвестного параметра стратегия И = g(v; х), для которой И^) > И(И).

Теорема 4. Пусть s = g(v; х) є 50. Тогда существует такая перестановочная стратегия s(0) = g(0)(v; х) є 50, для которой И^) > И(s(0)).

Доказательство. Обозначим через П(к, и) класс таких отображений Р(/') є П, что Р(к) = и при заданных значениях k, и є {1, 2, ..., т}. В силу равенства и = Р(к) и определения 1 получим соотношение Ри(Х1, Х2, ..., Хт) = Pp(k)(Хl, Х2, •••, Хт) = Р*(Хр(1), Хр(2), ..., Хр(т)) при Р(/') є П(k, и). Используя это, для s = g(v; х) выводим X Ри(х1, х2, ..., хт) X

(x1, x2,..., хт )є^т

Xg(k; ХР(1), ХР(2> •••, хР(т)) =

= X РкС^^ ХР(2> •••, хР(т)) Х

(x1, x2,..., хт )є^т

Xg(k; ХР(1), ХР(2), ., хР(т)) = Рк,* ({у : У(у) = к}). (4) Для s = g(v; х) согласно следствию 1 построим перестановочную стратегию So:

s(0) = g(0)(v; х) = gи> l(v; х1, х2, ., хт) =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

т

= т^‘ X g,,0(v^; Х1, Х2,..., хт ) =

I = 1

т т _

= т-1 X (т!)-1 X X g^ (к; х“(1) ’ х“(2) ’."’ х“(т) ) =

I =1 к =1 а(/) єП(к,г)

т

= (т!)-1 X X g(к; ха(1), Ха(2),..., ха(т)).

к=1 а(/) є П(к,у)

Для построенной перестановочной стратегии s(0) = g(0\v; х) є 5С с учетом равенства

Ри ,/0)({у: у(у) = и}) =

= X Ри(х1, х2, ., Хm)go(u; х1, х2, ., хт )

(x1,x2,...,хт )є^т

имеем:

т

X ри.(0)({у: у) = и}) =2 X Ри(хь

и=1 иєи (x1, х2^... хт )є^т

х2, ., хт)^'0) (и; х1, х2, ., хт ) =

т

= X X Ри(х1, х2, ., хт)х

и=1 (х1 ,х2,...,хт )єN

т

X (т!)-1 X X g(к; хР(1) , ХР(2),..., хР(т)) =

к=1 Р(/) єП(к,и)

= (т!)-12 2 2 2Ри Х2 ,..., Хт ) х

и=1 k=1 Р(1) еП(k,и)(х1,Х2,...,хт )еNm х ё (k; ХР(Гр ХP(2),..., ХР( т) ).

Отсюда, используя соотношение (4), последовательно выводим:

т

2 Р ,5(0)({у: у( у)=и}) =

и=1

т т

= (т!)-12 2 2 2Ри (Х1, Х2 ^.^ Хт ) х

и=1 k=1 Р(1) еП ( k ,и)( х1, Х2,..., хт )еNm

х ё (k; ХР(1), ХР(2),..., ХР( т) ) = т т

= (т!)-122 2Р*5 ({У: у(у) = ^) =

и=1 k=1 Р(г) е П(к,и) т

=(т!)-12 2Р^({у: у(у)=к})=

k=1 тс(г') еП т

= (т!)-1 2 2 Р^ ({у: у(у)=k}) =

тс(г') е П k=1 т

= 2 Р^ ,5 ({у: у( у) = k}). (5)

k=1

В силу теоремы 1 при каждом и = 1, 2, ., т выполняется соотношение Р (0)({у: у(у) = и}) =

= Р /°>({у : у(у) = “}), и поэтому имеет место

равенство вида Н(5(0)) = тах{(1 - Р (0)({у:

у(у) = и})): и е и} = 1 - Ри,5(0)({у : у(у) = и}).

Используя это и равенство (5), получим

Ри,5(0)({у: у(у) = и}) > min{pk, 5({у: у(у) = k}):

k = 1, 2, ..., т}. Так как выполняются равенства тт{Р^ *({у: у(у) = k}): k = 1, 2, ..., т} = тт{(1-

- Рк,*({у: у(у) ф k})): k = 1, 2, ..., т} = 1 -

- тах{Рк,*({у: у(у) ф к}): k = 1, 2, ..., т} = 1 -

- H(5), то Ри ,5(0)({у: у( у) = и}) = 1 - н(5(0)) > 1 -

- Н(5), или Н(5) > Н(5(0)). Теорема 4 доказана. Из этих теорем можно сделать два практических вывода.

Во-первых, вместо класса 5 всех стратегий целесообразно использовать более узкий класс 5' = 50 и 51 и 5С. В связи с этим величину Н0( 5') = inf{H(5): 5 е 5' } назовем минимаксным значением функции риска Н(и, 5) относительно класса 5'. Заметим, что элементами класса 5' являются как нестационарные перестановочные стратегии, так и нестационарные квазиперестановочные стратегии.

Во-вторых, минимаксные стратегии относительно класса 5' следует искать среди всех перестановочных и одновременно квазипереста-новочных стратегий, которые не зависят от неизвестного параметра и.

Экстремальная функция риска для перестановочных и квазиперестановочных стратегий

Рассмотрим вектор х = (х1, х2, ., хт) е Nm , который содержит е = е(х) различных компонент. Ради определенности допустим, что значения Ь(1) = Ь(1; х), Ь(2) = Ь(2; х), ., Ь(е) = Ь(е; х) этих компонент удовлетворяют условию Ь(1) < < Ь(2) < ... < Ь(е). При этом число компонент вектора х = (х1, х2, ..., хт), каждая из которых принимает значение Ь(у), равно с(у) = с(у, х), где у = 1, 2, ..., е. Ясно, что имеет место равенство с(1) + с(2) + ... + с(е) = т. Набор номеров для компонент вектора х = (х1, х2, ., хт), каждая из которых принимает значение Ь(у), обозначим через а(у,1), а(у,2), ..., а(у,с(у)). Итак,

Ха(уЛ) = Ха(у 2) = . = ха(/> у = Ь(/). Не ограничивая общности, в дальнейшем будем считать, что

a(у, 1) < a(у, 2) < •••< a(у, с(у)).

При k = 1, 2, ., т и у = 1, 2, ., е обозначим через Wk, у(х) множество всех различных векторов, каждый из которых получается с помощью перестановок компонент заданного вектора х = = (х1, х2, ., хт). При этом любой вектор множества Wk, у(х) имеет компоненту с номером к, значение которой равно Ь(у). Например, если

^ ^..^ Хт ) е Wk, у(х) и (ХГ, Х2', ..., Хт ) е Wk, /(Х),

то х’к = х'1 = Ь(у). Для перестановочного [1] распределения {Ри(Х1, Х2, ..., Хт): (Х1, Х2, ..., Хт) е е Nrn } случайного вектора (£1, £2, ..., £т) докажем следующее свойство.

Лемма 3. Если семейство {{ри(х1, х2, ..., хт): (х1, х2, ..., хт) е Nrn }: и е и} распределений вектора (£1, £2, ..., £т) является перестановочным, то для каждой пары векторов (х[, х'2,

..., xk-1, ЮХ Хк + 1,..., Хт ) , (х1' ^ ..., xk'-l, Ь(уX

Х;+1,...,хт) из множества Wк,у(х) выполняются соотношения

Рк(x;, .4..., хк^ кл хк+^..., хт) =

= Рк (x'l', А,..., xk-l, КЛ xk'+l,..., О (5)

Доказательство. Так как вектор (х[,

Х2,..., Хk-1, ЮХ Хк + 1,..., Хт ) е Iх) и вектор

(х" х" ..., КЛ xk'+l, ..., хт ) е Wk, у(х), то все-

гда существует такое отображение Р(-) е П, которое переводит вектор вида (х[, х'2,...,

Хk-1, ЮХ Хк + 1,..., Хт ) в вектор (xР(1), ХР(2) , ...,

1 7 1 1 \ _ / 11 11 11

ХР( к-1), Ьу , ХР(к+1),..., ХР(т)) = (Х1, Х2 , ..., Хк-1,

Ь(у), хк'+1,..., х'П ), если Р(к) = к. Учитывая равенство к = Р(к), определение 1 и свойства отображения Р(-) е П, последовательно получаем, что

рк (x;, x;,..., хк _l, юх хк+^..., хт) =

= РР(к )(xí, ■х^.- хкнух хк+l,..., хт) =

= рк (ХР(1), ХР(2), ..., ХР( к-1), Ь(у), ХР( к+1), ..., ХР( т)) =

/ 11 11 11 7 / 11 11 \

= Рк (Х1, Х2 , ..., Хk-1, Ь(у ), Хk+1, ..., Хт ) .

Так как равенство (5) имеет место для любой пары векторов из множества Wk у(х), то далее будем обозначать вероятности вида

Рк(x;, x;,..., хк-l, юх хк+l,..., хт),

/ 11 11 11 7 / 11 11 \

Рк (Хl, Х2 ,..., Хk-1, Ь(у ), Хk+1,..., Хт ) через функцию Рк^к, у(х)). Лемма 3 доказана.

Лемма 4. Пусть стратегия 5 = ёи(у; х) является перестановочной. Тогда для каждой пары

векторов ^ ^^.^ xk-l, Ьу , хк + 1,..., Хт ), (хГ,

х'2,..., хк'-1, Ьу, х'к+1,..., х"т) из множества Wk у(х) выполняются соотношения

ёк (к; ^^.^ xk-l, Ьу , Хк + l,..., хт ) =

= ёк(к; x'l', х2 ,..., хк'-1, ьу, хк'+1,..., хП). (6)

Доказательство. Вектор ( х', х'2,...,

xk-l,ь(у),хк+l,...,хт)^ку^ и вектор (хг,

x2',..., xk'-l, ка xk'+l,..., хт ) е Wkу(x). Поэтому

существует такое отображение Р(-) е П, которое переводит вектор (х', х2,..., хк-Г,

кл-,хк+l,...,хт) в вектор вида (xР(l),хР(2),..., ХР(к-1) , Ку'Х ХР(k+1),..., ХР(т)) = (х1' Х2',..., Хк'-1 , Ьу ,

хк+',..., х^), если только Р(к) = к. Учитывая равенство к = Р(к), определение 2 и свойства отображения Р(-) е П, для перестановочной стратегии 5 = ёк(у; х) находим:

ёРдаФМ; ^ x2,..., xk-l, КЛ хк+l,..., хт) =

= gk(v; ХР(1), ХР(2), ..., ХР(к-1), Ь(у), ХР(к+1), ..., ХР(т) ).

Левая часть последнего соотношения при Р(к) = =к и v=k равна выражению ёк(к; х', Х2,..., хк-Г,Ь(у),х’к+',...,х'т ), а правая часть с учетом равенств v = к и (ХР(1), ХР(2),..., хР(к-1),НА 1 1 \ / 11 11 11 7 / 11 11\ Хp(k+1),..., ХР(т)) = ^ Х2 ,..., Хk-1, b(У), Хk+1,..., Хт )

приводится к виду ёк (к; х" х"..., хк-', Ь(у), хк+',..., х^). Отсюда непосредственно получаем соотношение (6) для любой пары векторов

(х'\х^ ...,xk-l,НуХ xk+l,...,хт), (х1' x2',...,хк-1,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ь(у),хк'+',...,хП)из множества Wkу(x). Поэтому вероятности вида ёк (к; х', х^,..., х'к-Г, Ьу,

Г Г \ /~1 >> >> >> 1 >>

Хk + 1,..., Хт ) и ёк (к; Х1, Х2 , ..., Хk-1, Ьу , Хk+1,...,

х'т) естественно обозначить ниже через функцию ёк(к; Wk у(х)). Утверждение леммы 6 доказано.

Следствие 2. Если решающая функция 5 = ё^; х) является перестановочной и стационарной, то соотношение (6) примет вид

ё(к; xll, -4..., хк-', НуХ хк+l,..., хт) =

= ё(к;х'' x2,..., xil, Ь(Л xk'+l,..., х'т) =

=ё(к; Wk у(х)). (7)

Используя методику доказательства леммы 4 и определение 2, легко установить, что для стратегии 5 = ёи^; х) е справедливы соотношения (6) и (7).

Теорема 5. Пусть стратегия 5 = ё(у; х) является квазиперестановочной и стационарной. Тогда для любого вектора х е Nm выполняются соотношения

2с(у)ё(к;^,у(х))=' к=1,2,...,т. (8)

у=1

Доказательство. При любом фиксированном к = 1, 2, ., т из соотношения (7) при любом фиксированном г е {1, 2, ..., с(у)} имеем:

ё(к; ^, у(х)) =

= ё(к; xl, x2,..., Ха( у, ^ хк ,

Ха(у, 1)+1, ..., Хк - 1, Ха(у,г), Хк + 1, ..., Хт )

при а(у, г) < к;

ё(к; Wk, у(х)) =

= ё (к; xl, x2,..., хк - ', Ха( у,,■), хк + l,...,

Ха(у,г)-1 , Хк , Ха(у, ;)+1, ..., Хт )

при а(у, г) > к;

ё(к; Wk, у(х)) =

= ё(к; xl, x2, ..., хк-', Ха(у,г^ хк + 1,..., Хт) (11)

при а(у, г) = к.

Так как стратегия 5 = ё(у; х) является перестановочной, то отображение а(-) е П, а(и) = и при и ф к, и ф а(у, г), а(к) = а(у, г), а(а(у, г)) = к, позволяет соотношения (9)—(11) записать в виде

ё(к; Wk, у(х)) =

= ё(а(а(у\ г)); Х1, Х2 , ..., Ха(у,,■)-1, Хк ,

Ха(у, 1)+1, ..., Хк - 1, Ха(у,г) , Хк + 1, ..., Хт ) =

= ё (а(у\ г); xl, x2,..., ха(у ,,.)-l, Ха( у,г) ,

Ха( у, ,■)+1,..., Хк - ', Хк , Хк + 1,..., Хт ) =

= ё (а(у\ г); Х1, Х2 , ..., Хк - ', Хк , Хк + 1, ..., Хт ) при а(у, г) < к;

ё(к; Wk, у(х)) =

= ё(а(а^./■, г)); Х2 , ..., Хк - ', Ха(у,{Р

Хк + 1, ..., Ха(у,г)-1 , Хк , Ха(у, 1)+1, ..., Хт ) =

= ё(а(у\г); xl, x2,..., хк-', хк, (13)

(13)

Хк + 1, ..., Ха(у, 1)-1, Ха(у,г) , Ха(у,г)+1, .", Хт ) =

= ё (а(у\ г); Х1, Х2 , ..., Хк - ', Хк , Хк + 1,..., Хт )

(9)

(10)

(12)

х gk (k; Уl, y2 , ..., ym ) =

e( X)

Ч,

= 2 21 Wk ,j (X1, X2 , ..., Xm )| Х

x1<x2 < - <Xm j=

при a(j, i) > k; e(x)

g(k; Wk, jx)) = =22 2 Pk У У 2 ,..., ym) х

= g (k X X X X X X ) = x1< x2 < - < xm j=1 (У1, У2,..., ym )eWk, j(x)

gyii, Л-1, A-2,..., л-k-^ a( j ,i)’ "4 +1> •••> m / _

= g(k- X X X X X X ) = (14) Х gk (k; У1, У2,..., ym).

-4— 1? Xa(j,i)’ Xk + 15-"J m / TT , ,,

= Используя функции Pk(Wk,j(x)), gk(k; Wk, jx)),

= g(k; x1, x2,. ., xk-1, xk, xk+1,. ., Xm) которые были введены для равенств (5), (6), и

при a(j, i) = k. соотношение | Wk, ;(x)| х m = | W(x)| х c(j) , из (16)

Из (12)—( 14) получаем, что при j = 1, 2, ..., e легко найдем:

имеет место равенство c(j)g(k;Wkj(x)) = Pk, ¿({y: y(y) = k}) =

c(j) e(x)

= 2 g(a(j', г); X1, X2, ..., Xm). Суммируя это ра- =2 2 2Pk (У^ Уз — ym ) х

i=1 x1<x2 < ... <xm j=1 (У1,У2 ,..., ym )eWk, j (x)

венство по j и принимая во внимание определение величин e(x), c(j) и a(j, i), непосредственно найдем:

2 c(j)g (k; WkJ (x)) =

х pk (Wk,j (x))gk (k; Wk,j (x)) =

e(x) c(j) 1

= 22 g(a(j^ i)'; X1, X2, ..., Xm) = = — 21 W (X1, X2 , ..., Xm )| х

j=1 i=1 m X1 <x2 < .. <xm

m e( x)

= 2g(v;xl,X2^.^xm) =1 х2c(j)Pk (Wk j (x))gk (k; Wk j (x)).

v=1 j=1

для каждого фиксированного k = 1, 2, ., m. Отсюда и следует соотношение (15), теорема 6

Теорема 5 доказана. доказана.

Обозначим символом W(x) = W(xb X2, ..., Xm) Замечание 2. Применяя метод доказательст-

множество всех различных векторов, каждый из ва теоремы 6 для перестановочной стратегии и

которых получается с помощью перестановок справедливое соотношение (6) для решающей

компонент заданного вектора x = (xb X2, ..., Xm). функции 5 = gu(v; x) из множества S1, легко ус-

Если 1 W(x)| и 1 Wk,;(x)| - число элементов множе- тановить, что для любой квазиперестановочной

ства W(x) и Wk, j(x) соответственно, то |W(x)|= стратегии имеет место соотношение (15).

= m!/((c(1))! х (c(2))! х ... х (c(e))!) и |Wk, jx)| х m =

= |W(x)| х c(j) [5]. Список литературы

Теорема 6. Пусть стратегия 5 = gu(v; x) является перестановочной. Тогда 1 Федоткин МА Задача оптимизации для пере-

тт/ч . /ч 7-»ч становочного семейства вероятностных моделей сис-

H(5) = 1 — Pk s({ y: y(y) = k}) = //T^ TT

4 ' i w j/ Тем с управлением // Вестник Нижегородского уни-

= 1 L 2 lW(x x X )1 х верситета им. Н.И. Лобачевского. 2012. № 5(2).

m^J?<x *’ 2”"’ ' С. 222—227.

X1 <x2 < ... <xm , -х

e(x) (15) 2. Zorine A.V., Fedotkin M.A. Optimization of Con-

х2 c( j) p (W (x))g (k; W (x)) trol of Doubly Stochastic Nonordinary Flows in Time“ k k,j k ’ k,j Sharing Systems // Automation and Remote Control.

Доказательство. Применяя формулу (2) для 2005. Т. 66. № 7. С. 1115—1124.

/ \ v 3. Пройдакова Е.В., Федоткин М.А. Управление

стратегии gu(v;x) е S, определения множеств r г _

выходными потоками в системе с циклическим об-

W(x) и Wk, j■(x), для вероятности Pk, 5({y: y(y) = k}) служиванием и переналадками // Автоматика и теле-

имеем: механика. РАН. 2008. № 6. С. 96—106.

Pk, 5({y: y(y) = k}) = 2 Pk(x1, x2, • ••, Xm)x 4. Федоткин М.А., Федоткин А.М. Анализ и оп-

(xl,x2,...,Xm)eN тимизация выходных процессов при циклическом

xgk(k; x1, x2, ..., xm) = управлении конфликтными транспортными потока-

= 2 2 P (V V V ) х ми Гнеденко—Коваленко // Автоматика и телемеха-

^ <xm (y^^m)*W« m (16) ника. РАН. 2009. № 12. C. 92—108.

5. Федоткин М.А. Модели в теории вероятностей.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

х gk( ; y2,..., Ут) = м.: Наука-Физматлит, 2012. 608 с.

PROPERTIES OF PERMUTATION AND QUASI-PERMUTATION STRATEGIES OF DISCRETE CONTROL SYSTEMS

M.A. Fedotkin

As a rule, it is possible to construct an adequate probabilistic model (Q, &, P(-))for a statistically stable experiment (control system) Э only in simple cases. To solve this problem for the experiment Э of a complex structure, an approach has been suggested in [1] which is based on a parametric set U with elements u and a family {(Q, P„Q): u e U} of probabilistic models. A difficult optimization problem arises here: to choose by some criterion from the family {(Q, i, PMQ): u e U} in some cases, an adequate model for the experiment Э, and, in other cases, a target model for this experiment [2-4]. Using notation and results from [1], the article considers the problem for a class of permutation and quasi-permutation strategies.

Keywords: control system, probabilistic model, permutation distributions, sample space, extremal risk function, permutation strategy, quasi-permutation strategy.

References

1. Fedotkin M.A. Zadacha optimizacii dlya peresta-

novochnogo semejstva veroyatnostnyh modelej sistem s upravleniem // Vestnik Nizhegorodskogo universiteta im. N.I. Lobachevskogo. 2012. № 5(2).

S. 222-227.

2. Zorine A.V., Fedotkin M.A. Optimization of Control of Doubly Stochastic Nonordinary Flows in TimeSharing Systems // Automation and Remote Control. 2005. T. 66. № 7. S. 1115-1124.

3. Projdakova E.V., Fedotkin M.A. Upravlenie vy-hodnymi potokami v sisteme s ciklicheskim obsluzhiva-niem i perenaladkami // Avtomatika i telemekhanika. RAN. 2008. № 6. S. 96-106.

4. Fedotkin M.A., Fedotkin A.M. Analiz i op-timizaciya vyhodnyh processov pri ciklicheskom uprav-lenii konfliktnymi transportnymi potokami Gnedenko-Kovalenko // Avtomatika i telemekhanika. RAN. 2009. № 12. S. 92-108.

5. Fedotkin M.A. Modeli v teorii veroyatnostej. M.: Nauka-Fizmatlit, 2012. 608 s.

i Надоели баннеры? Вы всегда можете отключить рекламу.