Научная статья на тему 'Многостадийные соревновательные игры'

Многостадийные соревновательные игры Текст научной статьи по специальности «Математика»

CC BY
91
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭСТАФЕТА / СОРЕВНОВАТЕЛЬНАЯ ИГРА / M-ПАРАЛЛЕЛЬНЫЙ ПОЛУМАРКОВСКИЙ ПРОЦЕСС / ДИСТАНЦИЯ / ЭТАП / ПРОСТРАНСТВО СОСТОЯНИЙ / ЭВОЛЮЦИЯ / РАСПРЕДЕЛЕННЫЙ ШТРАФ / РЕАЛИЗАЦИЯ ТРАЕКТОРИИ / РЕКУРРЕНТНАЯ ПРОЦЕДУРА / RELAY-RACE / CONCURRENT GAME / M-PARALLEL SEMI-MARKOV PROCESS / DISTANCE / STAGE / STATE SPACE / EVOLUTION / DISTRIBUTED FORFEIT / TRAJECTORY REALIZATION / RECURRENT PROCEDURE

Аннотация научной статьи по математике, автор научной работы — Ларкин Евгений Васильевич

Показано, что многостадийные соревновательные игры, или эстафеты, часто встречаются в практической деятельности. Предложено моделировать эстафету в пространстве состояний, дискретные координаты которого являются математическим аналогом этапов, проходимых в текущий момент участниками, а базовым принципом моделирования пребывания участников в состояниях пространства является M-параллельный полумарковский процесс. Получены зависимости, положенные в основу расчета временных и вероятностных характеристик эволюции эстафеты. Для произвольной реализации траектории переключений разработана рекуррентная процедура эволюции эстафеты с оценкой вероятности временных и вероятностных характеристик исследуемой реализации. Введено понятие распределенного штрафа, зависящего от разности этапов, на которых находятся попарно конкурирующие участники. Получена зависимость для оценки суммы штрафа, которую получает каждый из участников.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MULTISTAGE CONCURRENT GAMES

It is shown that multistage concurrent games, or relay-races, are widely used in practice. It is proposed to model relay-races in the state space, in which discrete co-ordinates are the mathematical analogue of stages, which participants pass in the current time, and basic principle of modeling of residence of participant in space states is the M-parallel semi-Markov process. With use the proposed formalisms formulae for evaluation of stochastic and time characteristics of relay-races evolution are obtained For arbitrary realization of switching trajectory the recurrent procedure of evolution with evaluation of stochastic and time characteristics of realization under investigation is worked out. Conception of distributedforfeit, which depends on difference of stages ofparticipants compete in pairs is introduced. Dependence for evaluation of total forfeit of every participant is obtained.

Текст научной работы на тему «Многостадийные соревновательные игры»

ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА, ОБРАБОТКА И ЗАЩИТА ИНФОРМАЦИИ

УДК 519.21

МНОГОСТАДИЙНЫЕ СОРЕВНОВАТЕЛЬНЫЕ ИГРЫ

Е.В. Ларкин

Показано, что многостадийные соревновательные игры, или эстафеты, часто встречаются в практической деятельности. Предложено моделировать эстафету в пространстве состояний, дискретные координаты которого являются математическим аналогом этапов, проходимых в текущий момент участниками, а базовым принципом моделирования пребывания участников в состояниях пространства является М-параллельный полумарковский процесс. Получены зависимости, положенные в основу расчета временных и вероятностных характеристик эволюции эстафеты. Для произвольной реализации траектории переключений разработана рекуррентная процедура эволюции эстафеты с оценкой вероятности временных и вероятностных характеристик исследуемой реализации. Введено понятие распределенного штрафа, зависящего от разности этапов, на которых находятся попарно конкурирующие участники. Получена зависимость для оценки суммы штрафа, которую получает каждый из участников.

Ключевые слова: Эстафета, соревновательная игра, М-параллельный полумарковский процесс, дистанция, этап, пространство состояний, эволюция, распределенный штраф, реализация траектории, рекуррентная процедура.

Многостадийные соревновательные игры, в которых игровая ситуация развивается в физическом времени, или «эстафеты», объективно существуют в различных областях человеческой деятельности: экономике, обороне, спорте, политике и т.п. [1, 2, 3, 4]. В играх подобного типа «дистанция», которую необходимо преодолеть участникам, разбивается на «этапы» и эффективность участия в эстафете оценивается не только по общей «победе» в соревновательной игре, но и по результатам прохождения «участниками» отдельных «этапов» (ниже термины «эстафета», «дистанция», «этап», «победа» «штраф», «победитель» будут использоваться без кавычек).

В этой статье приняты следующие допущения [5]: соревновательная игра сводится к прохождению участниками равной для всех дистанции в реальном физическом времени;

дистанция каждого участника разбивается на этапы, каждый из которых имеет номер, одинаковый для всех участников;

этапы с равными номерами имеют равную длину; все участники начинают прохождение дистанции в один и тот же момент времени;

время прохождения каждого из этапов каждым из участников случайно и определено индивидуально для него с точностью до плотности распределения;

после завершения очередного этапа участником он приступает к прохождению следующего этапа без задержек по времени;

прохождение дистанции каждым из участников завершается после прохождения последнего этапа;

выигрыш или проигрыш на этапе понимается как достижение конца этапа на первом или не на первом месте;

значение штрафа, заплаченного проигравшим победителю, распределено во времени и зависит от разности этапов, на которых находятся победитель и проигравший.

1. Эстафета как М-параллельный полумарковский процесс Дистанции, этапы и участники показаны на рис. 1. На рисунке и ниже используются следующие индексы: 1 < т, п < М - номера соревнующихся субъектов; 0 < i,j<J- номера этапов, или номера пунктов передачи эстафеты. Пункт с номером 0 является стартовым. Пункт с номером J является особым: участник, достигший этого пункта, завершает соревнование. Между двумя соседними пунктами расположен этап. Номер этапа определяется по номеру пункта, предшествующего соответствующему этапу. Часть индекса, заключенная в скобки, относится к номеру участника, так i{m) - номер этапа, который в текущий момент времени проходит т-й участник, 0 < i(m) <J,\<m<M.

0(1) ... /(1) ... JjVth J(l) 0(2) ^ i(2) ^ J{2)-l J{2)

Шй__ъ—JLüü____Jim)

мм)_ш _\jm-\lm

0 1 ... г /+1...J-1 J Номер этапа

Рис. 1. Дистанции, этапы и участники эстафеты

*

«в 1 н

* о

<D 2

*

ю

...

о

& т о

X -

М

Модель эстафеты с М участниками может быть представлена как М-параллельный полумарковский процесс [6. 7], определенный вектором

hit) = fe (/),hm (i), .... К (/),hM (f )], (1)

где t - время; hm\t) - m-я полумарковская матрица размером (J+l)x(J+l), представляющая модель прохождения дистанции т-м участником;

)WJ; (2)

ht 4M-M(w)(i)'when/(m) = >W + 1'

"j(m),l(m)K4 ~ m all Qther cases;

fi{m)V) " плотность распределения времени, за которое т-й участник проходит i-ii этап своей дистанции.

Для плотностей распределения /)(„,)(/) выполняются следующие

условия:

Jtfi(m){t)dt < оо при 0 < i(m) <J, 1 < т < М\

(3)

fj(m)(t)= lim б(/-т), \<т<М,

х—>оо

где - т) - смещенная 5-функция Дирака.

Первое условие означает, что все участники проходят все этапы, кроме последнего, за конечное время. Второе условие означает, что достижение участником финиша (состояние J) может рассматриваться как начало J-ro этапа с бесконечным временем его прохождения.

Номера этапов могут быть упорядочены в кортеж р = (0...,j), М-я декартова степень которого дает М-мерное пространство состояний М-параллельного полумарковского процесса: s = рм (рис. 2).

KM) se=(J,...9J,...9J)

Рис. 2. Пространство состояний s

54

Координаты пространства закреплены за соревнующимися участниками, а дискретные значения координат определяют номера пунктов передачи эстафеты. В пространстве определен М-мерный вектор состояния

S = [i(l),..., i(m),..., i(M)], (4)

где i(m) - номер этапа, на котором в текущий момент времени находится m-й участник.

Всего эстафета может быть в одном из (J + iM состояний. Старт моделируется начальным состоянием вектора Sb = (0, ..., 0, ..., 0). Блуждания по М-параллельному полумарковскому процессу имеют характер эволюции, которая происходят за счет инкрементирования на единицу элементов вектора S. При любых переключениях инкрементирующий элемент является единственным. Переключения происходят до достижения конечного состояния Se = (J, ..., J, ..., J). Общее количество переключений состояний полумарковского процесса при эволюции равно R = JM.

2. Общие зависимости для определения параметров эволюции

При эволюции ординарные полумарковские процессы вступают между собой в соревнование [2, 5]. В том случае, если соревнование начинается одновременно, и в нем участвуют плотности распределения 01 (t),..., 0a(t),..., 0a (t), то первой зависимостью, необходимой для моделирования эстафет, является плотность распределения времени до первого переключения, которая определяются как

0w(t)= Z0wa(t)= Z 0a(t)П[1 -0ß(t)L (5)

a=1 a=1 ß=1

ß^a

где 0wa(t) - взвешенная плотность распределения того, что победителем в

t

соревновании будет a-й процесс; 0ß(t )= J 0ß(x)dx - функция распределе-

0

ния.

Вероятность победы a-го процесса и невзвешенная плотность распределения равны, соответственно:

Рwa = j0wa(t)dt; jWa=0^. (6)

0 p wa

Справедливо следующее утверждение

Утверждение 1. Если для плотности распределения 0a(t) выполняется ограничение (3), т.е. 0a(t)= lim 5(t -1), то pwa = 0.

Действительно, в этом случае

Pwa = Jf lim 5(t-t) 1П[1 -0ß(t)d = lim П1 -®ß(*)] = 0.

0 ß=1, x®¥ß=1, ß^a ß^a

55

Если среди функций распределения 0ß(t) имеются функции, для которых 0ß(t)= lim -t), где h(t-t) - смещенная единичная функция

Хэвисайда, то всегда можно потребовать, чтобы возникающая неопреде-

¥

ленность разрешалась как lim J 5(t -t)h(t-t)dt = 0. Таким образом ут-

t®¥ 0

верждение 1 доказано.

Второй зависимостью, необходимой для моделирования эстафет, является зависимость для плотности распределения времени ожидания. В том случае, если в соревновании участвуют два процесса, 0a(t) и 0ß(t), и

победителем оказывается процесс qß (t), то плотность распределения временем ожидания процессом 0ß(t), когда завершится процесс 0a(t), определяется как [2, 5]

¥

h(t) J 0ß(X)0a(t + X)dX Öß®a(t ) =-¥-. (7)

J Qß(t )d©a(t) 0

Утверждение 2. Если для плотности распределения 0a(t) выполняется ограничение (3), то нижняя граница области определения и математическое ожидание плотности распределения времени ожидания стремятся к бесконечности.

Действительно, в этом случае знаменатель (7) принимает вид

¥

J ©ß(t) lim 8(t -t)dt = 1. 0 t®¥

Нижняя граница области определения плотности распределения 0ß(t) имеет значение min{arg[0ß(t)> 0_|j= Tßmin > 0. Нижняя граница числителя (7) определяется как

¥

min arg J 0ß(X) lim 5(t -1 + X)dX > 0 = lim (Tß mjn +1) ® ».

0 t®¥ t®¥

Известно [8], что для любой случайной величины математическое ожидание лежит в интервале Tmjn £ T £ Tmax, где T - математическое ожидание, Tmin, Tmax - нижняя и верхняя границы области определения. Сле-

¥

довательно, если Tß mjn ®¥, то Tß ®¥, где Tß = Jt0ß(t)dt - математиче-

0

ское ожидание времени, завершения процесса 0ß(t). Таким образом, утверждение 2 доказано.

Утверждение 3. Если плотность распределения 0a(t) обладает свойством min arg 0a (t) = Ta mjn ® ¥, то

^ Ar

pwa = j Öa(t) П 1 "Öß(t№ = 0.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0 ß=1, ß^a

Действительно, плотность 0a(t) может быть представлена как результат мультипликативной дискретизации функции с бесконечно малым периодом дискретизации:

¥

Öa(t)= lim IÖa(t)d(t -Ц), (8)

Z®o i=о

где Z®0 - период дискретизации.

Все отсчеты функции (8) лежат в области t > Ta min ® ¥, поэтому

¥

0a(t )= lim lim 16a(t )5(t - Ta min -Zl),

Ta min ®¥Z®01=0

откуда, в соответствии с утверждением l

_ A

lim lim 10a(t)d(t - Ta min - Cl)

Ta min ®¥Z®01=0

p wa

П [l-Qß(t )]dt = 0.

ß=1, ß^a

Утверждение 4. Если плотности распределения 0а(?) обладает свойством тта^ 0а^) = Та т^п ®¥, то нижняя граница области определения и математическое ожидание плотности распределения времени ожидания стремятся к бесконечности.

Действительно, в соответствии с промежуточным результатом утверждения 2 этом случае знаменатель (7) принимает вид

j0ß(t) lim lim 10a(t)ö(t - Tamin - Zl)dt = 1. Нижняя граница числи-

0 Ta min ®¥C®01=0

теля (7) в данном случае определяется как

¥ ¥

minarg j 0ß(x) lim lim 10a(t )d(t - Ta min - №> 0 = Ta min ®¥.

0 Tamin ®¥Z®01=0

С использованием полученных зависимостей и доказанных утверждений может быть построена рекурсивная процедура эволюции эстафеты. 2. Рекурсивная процедура эволюции эстафеты Эволюция эстафеты развивается в результате соревновательного процесса [9, 10, 11, 12].

¥

¥

Введем понятие реализации траектории переключений в пространстве состояний ^ (рис. 2). Под траекторией понимается реализация случайной последовательности переключений вектора S, начиная с состояния Sъ, и оканчивая состоянием Se. Траектория является случайной, реализация траектории конкретна для каждого конкретного случая эволюции [6, 8].

Рассмотрим некоторую к-ю реализацию эстафеты.

При старте с состояния Sъ = (0, ..., 0, ..., 0), г = 0, соревнующиеся участники начинают проходить нулевые этапы своих дистанций. При этом в соревновании участвуют исходные плотности распределения из первых строк матриц (2). Пусть на общем для всех участников нулевом этапе побеждает п-й участник. Вероятность его победы определяется зависимостью, полученной из (5) [13]

¥ М Г

Р0, к = |0 80(п)(') П 1-)(' Ж', (8)

0 7=1,

7 ф п

г 0

где "О... (г)-1-8...(ъ)^ - функция распределения; 80(у)(г) = /о(у)(г) -0

плотности распределения, участвующие в соревновании на нулевом этапе, 0(1) £ 0(7 )< 0(М); верхний левый индекс указывает на количество предшествующих переключений; правый нижний индекс указывает на номер этапа, на котором находится 7-й частник.

Плотность распределения времени, затраченного п-м участником (в данной реализации победителем нулевого этапа), на прохождение своего отрезка дистанции определяется по зависимости, полученной из (5)

п М г

0 80(п)(г )П 1-)(г) 7=1,

Ф0,к (г ) =--. (9)

р0,к

После победы п-го участника на нулевом этапе он приступает к прохождению первого этапа, при этом все оставшиеся участники продолжают проходить нулевые этапы. Поэтому в соревновании после г = 1 переключений участвуют следующие плотности распределения:

18 ( л(г) = 180(п)®0(7)(г),when 7 Ф п; (10)

( 7)(г) \/(п )(г), when 7 = п; (10)

где 80(п)®0( 7)(г) - плотность распределения времени ожидания п-м участником, когда 7-й участник завершит нулевой этап, определяемая по зависимости (7).

В 8'(7)(') из (10), в данной конкретной рассматриваемой реализации, /(1) = 0, ..., ¡{ш) = 0, ..., '(п) = 1, ..., /(М) = 0.

58

Далее проведем анализ ситуации, которая сформировалась в рассматриваемой к-й реализации после г переключений. В соответствии с условиями эволюции общее количество переключений равно

м

I ¡(7 )= г, (11)

7=1

где ¿(1), ..., ¡(ш), ..., ¡(п), ..., ¡(М - в общем случае разные значения индексов, определяющих номера этапов, проходимых участниками в рассматриваемой к-й реализации после г переключений.

Обозначим плотности распределения, участвующие в соревновании после г переключений, как г&ш(0, ..., rgi(ш)(t), ..., г&(п)(0, ..., г&(.м(0. Пусть в ситуации, сложившейся в к-й реализации в результате рекурсивной процедуры побеждает 1-й участник. Вероятность его победы определяется зависимостью, полученной из (5)

¥ М

pr,k = i g(l) (t) П 0 7=1,

j *l

1 -

r

G<(. j )( ')

dt.

(12)

где r gi(j )(t ) - плотности распределения, участвующие в соревновании после r переключений.

В частности, если после r переключений в k-й реализации побеждает первый участник, то вероятность его победы равна

¥ M Г

pr, k = î rgi(i)(t )п 1-rGt(j )(t )dt.

0 7=1,

j *1

Плотность распределения времени, затраченного l-м участником, в общем случае равна

M г 1

rgr{l )(t )П 1-rGl{j )(t ) j=1,

j *l -, (13)

jr k (t )

pr ,k

в k-й реализации

jr k (t )

M

gi(1)(t )П j=1, j *1

1-

G j )(t )

pr ,k

Отметим, что после J переключений в М из М реализаций возникает ситуация, когда вектор Я принимает одно из следующих значений: 0, ..., 0, ..., 0), ..., (0, ..., 0, J, 0, ..., 0), ..., (0, ..., 0, ..., 0, J). После этого количество возможных исходов соревнований при следующем переключении из

r+1

gn j )(t )=

указанных состояний уменьшается на единицу. Если m-й участник достигает состояния J, то вероятность выхода из этого состояния, в соответствии с доказанными выше утверждениями 1 и 3, равна нулю.

После победы l-го участника при r-м переключении он приступает к прохождению [¿(/)+1]-го этапа. При этом все оставшиеся участники продолжают проходить ¿'(/)-е, этапы, 1 £ J £ M, J Ф l. Поэтому в соревновании за (г+1)-е переключение в общем случае участвуют следующие плотности распределения:

Г rSl{i)®l{j)(t), when j ф l; (14)

f( l )+1 (t) ,when J _l,

где gi(i)®i( j) (t) - плотность распределения времени ожидания, определяемая по зависимости (7).

В частном случае, при k-й реализации побеждает первый участник, за (г+1)-е переключение участвуют следующие плотности распределения:

rgi(1)®i(j)(t),when j ф 1; /i{1)+1(t ),when j _1

И наконец, пусть в рассматриваемой k-й реализации после (R-1)-ro переключения установилось состояние

i(l) _ J, when l Ф m;

^ ' _ J -1, when l _ m;

M

I i(l)_ R -1.

l _1

Вероятность победы m-го участника определяется зависимостью, получаемой из (6)

M

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

r +1

gi( J )(t)_

1-

R-1

GJ(l)(t)j^t.

(15)

р Я—1, к = | gJ (т)—1 )П 0 I=1,

I ф т

В силу утверждений (1) и (3) эта %я—1 к = 1- Вероятности побед остальных участников, как достигших состояния J, равны нулю. Плотности распределения времени пребывания в состояниях после Я переключений равны:

Я—1

R

gi( J )(t)_

gJ(m)-1®J(l)(t),when l Ф m,

определяется утверждениями 2 и 4; fJ (m)(t), определяется ограничением (3).

Результаты применения рекурсивной процедуры для к-й реализации сведены в табл. 1.

Таблица 1

Применение рекурсивной процедуры для к-й реализации

г S Плотности распределения

0 0, ..., 0, ..., 0, ..., 0 /с^^ ...,^(т^ ...,^(П^ ..., /0(М) 0 0 0 0 ^О^ ..., ^(т^ ..., g0(И), ..., ё0(М)

1 0, ..., 0, ..., 1, ..., 0 0 0 г 0 g0(n)®0(1), ..., g0(n)®0(m), ...,/1(n), ..., &(и)®0(М) ..., 1g0(m), ..., 1g1(n), ..., 1g0(M)

2 0, ..., 1, ..., 1, ..., 0 1 г 1 0 g0(m)®0(1), ..., /l(m), ..., g0(m)®1(n), ..., g0(m)®0(M) 2 2 2 2 g0(1), ..., g1(m), ..., g1(n), ..., g0(M)

3 0, ..., 1, ..., 2, ..., 0 2 2 г 2 g1(n)®0(1), ..., g1(n)®1(m), ...,/2(n), ..., g2(n)®0(M) 3 3 3 3 g0(1), ..., g1(m), ..., g2(n), ..., g0(M)

4 0, ..., 1, ..., 3, ..., 0 3 3 г 3 g2(n)®0(1), ..., g2(n)®1(m), ...,/3(n), ..., g2(n)®0(M) 4 4 4 4 g0(1), ..., g1(m), ..., g3(n), ..., 8,0(М)

г /(1), ..., От), ..., ¿(и), ..., /(М) г г г г gi(1), ..., gi(m), ..., &(П> ..., &(М)

г+1 /(1) + 1, ..., ¿(т), ..., /(и), ..., /(М), г г г г /ад+Ъ ..., gi(1)®i(m), ..., gi(1)®i(n), ..., gi(1)®i(M) г+1 г+1 г+1 г+1 gi(1), ..., ..., gi(n), ..., gi(M)

Я-2 /(1), ..., /(т)-1, ..., /(и), ..., /(М)-1, Я-2 Я-2 Я-2 Я-2 <?/(1> ..., g/(m)-1, ..., g/(n), ..., /М)-1

Я-1 /(1), ..., /(т)-1, ..., /(и), ..., /(М), Я-2 Я-2 g/(M)-1®/(1), ..., g/(M)-1®/(m)-1, ..., Я-2 g /(М)-1®/(П> ..., //(М) Я-1 Я-1 Я-1 Я-1 g/(1), ..., g/(m)-1, ..., g/(n), ..., /М)

Я /(1), ..., /(т), ..., /(и), ..., /(М), Я-1 g/(m)-1®/(1), ..., //(m), ..., Я-1 Я-1 g/(m)-1®/(n), ..., g/(m)-1®/(M) Я Я Я Я g/(1), ..., g/(m), ..., g/(n), ..., g/(M)

Вероятность к-й реализации эстафеты и плотность распределения времени завершения эстафеты при условии к-й реализации определяется по зависимости [14]

R-1

pk _ Пр£,r

r _ 0

(16)

Фк (0 = Ь~1 Щфк,г (')], (17)

г=0

где Ь[...] и Ь~1[--.] - прямое и обратное преобразование Фурье соответственно.

Общее количество реализаций К быстро растет как с увеличением количества участников, так и с увеличением количества этапов («проклятие размерности» Р. Беллмана [1]). Ограничивает рост количества тот факт, что при переключениях часть участников достигает J-го этапа, и дальнейшая эволюция по этой ветви, в соответствии с доказанными утверждениями, невозможна.

3. Оценка эффективности стратегии эстафеты Естественной для оценки эффективности является модель, в которой:

рассматриваются пары участников, например т-й и п-й; участник, достигший этапа с большим номером, получает от участника, находящегося на этапе с меньшим номером, штраф;

штраф определяется в виде распределенного платежа с/-(т)/-(п),

величина которого определяется как доля суммы, которую в момент времени ? получает участник, находящийся на этапе с большим номером от участника, находящегося на этапе с меньшим номером.

Элементы с(т)г(п) укладываются в четырехмерную матрицу

размером ^ + 1) х ^ + 1) х М х М:

п(1 )=[птпк)], 1 £ т, п < М, (18)

где

cm, n (t)

c0(m ),0(n )(t) ... c0(m),i(n)(t) ... c0(m), J (n )(t)

ci(m ),0(n ci(m),i (n )(t) ... ci(m), J (n )(t)

cJ (m ),0(n )(t) ... cJ (m ),i(n )(t) ... cJ (m), J (m )(t)

Матрицы cm m (t) _ 0 для 1 £ m £ M , где 0 =

(m) '0 ... 0Л

(19)

v0 ...

нулевая

матрица. В общем случае стп^) является несимметричной. Элементы, лежащие на главной диагонали с(т )г(п)(?) = 0, если ¡(т) = ¡(п). Элементы

62

матрицы, лежащие выше главной диагонали, характеризуют платежи т-го участника и-му. Элементы, лежащие ниже главной диагонали, характеризуют платежи и-го участника т-му.

Выделим из общей к-й реализации только элементы ¡(т) и /(и), и составим таблицу к2,т,и-й реализации рекурсивной процедуры парной эстафеты.

Анализ эволюции показывает, что ситуация, которая изменяет условия штрафных платежей, возникает при победе одного из участников и кончается при следующем переключении. Если после г переключений соревнуются плотности гgi(m)(t) и гgi(n)(t), то сумма платежа, может быть найдена с использованием формулы (5):

г, к 2

12, т, и

С

т, п

0

т) V Лт/ т )/(п. (20)

к2,т,п~я реализация парной эстафеты

Таблица 2

г Я Плотности

0 0, 0 ^т)-, fo(n), 0 0 g0(m), g0(n)

1 0, 1 g0(n)®0(m), А(и) g0(m), ^(и)

2 1, 1 А(т) , 1<§0(т)®1(и)

г ¡(т), ¡(и) г г gi(m), бг(и)

г Я Плотности

г+1 ¡(т)+1, ¡(и) ./¡'(тНЪ §1(т)®1(и) г+1 _ г+1' бг(т)+1, бг(и)

Я-2 3(т)-1,3(и)-1 Я-2 Я-2 gJ(m)-1, <§У(и)-1

Я-1 3(т)-1, У(и) Я-2 ^3(т)-1 ®3(и)--1,3) gJ(m)-1, &(и)

Я 3(т), 3(и) .//(m), gJ(n) ®3(т)-1

При этом и-й участник платит т-му, если ¡(т) > ¡(и), и т-й участник платит и-му, если ¡(т) < ¡(и).

Для к2ти-й реализации эстафеты по зависимостям, полученным из (5), могут быть найдены вероятности рг к2т и, соответствующие конкретному порядку переключений. Таким образом, суммарный выигрыш т-го участника определяется как

М к 2 2 3 (2 3

К

т

I I Пр г, к

и=1, к2,т,и =1 г=0 и ф т

г, к 2, т, и

Ег,к2,т,и^ 2 С

V г=0

т, и

(21)

где К2 - общее количество реализаций парной эстафеты, включающей 3 этапов.

Очевидно, что сумма выигрыша всех участников равна нулю.

4. Заключение

Мы представили соревновательную игру как эстафету, в которой участники проходят дистанцию, разбитую на этапы, время прохождения которых известно с точностью до плотностей распределения. Использование понятия M-параллельного полумарковского процесса и зависимости для оценки времени ожидания позволило разработать рекуррентную процедуру эволюции эстафеты. На основании общей рекуррентной процедуры построена процедура парной эстафеты, для которой с использованием понятия распределенного штрафа получено выражение для оценки штрафа за этап. Суммирование поэтапных штрафов позволило оценить общую сумму штрафа в эстафете. Оценка обшей суммы штрафа является ключом к формированию оптимальных стратегий многостадийных динамических соревнований, если стратегия и тактика могут менять плотности распределения времени прохождения участниками этапов дистанции.

Дальнейшие исследования в данной области могут быть направлены на отыскание зависимости, связывающей количество участников, количество этапов и общее количество траекторий эволюции эстафеты, а также генерации траектории, по номеру реализации (пока это делается алгоритмически), что позволит преодолеть «проклятие размерности». Также возможна разработка математического аппарата, который свяжет предложенную модель эстафет с классической теорией игр и метода генерации оптимальных стратегий эволюции в эстафете [15, 16].

Список литературы

1. Bellman R.E. Dynamic Programming. N.Y. USA: Dover Publications, Inc. 2003. 339 p.

2. Ivutin A.N, Larkin E.V. Simulation of Concurrent Games // Bulletin of the South Ural State University. Series: Mathematical Modelling, Programming and Computer Software. Chelyabinsk, 2015. Vol. 8, № 2. P. 43 - 54.

3.Chatterjee K., Jurdzinski M., Henzinger T. Simple stochastic parity games // Lect. Notes Comput. Sci. 2003. Vol. 2803. P. 100-113.

4. Ivutin A.N., Larkin E.V., Kotov V.V. Established Routine of Swarm Monitoring Systems Functioning // Advances in Swarm and Computational Intelligence. Lecture Notes in Computer Science. Springer International Publishing, Switzerland, 2015. Vol. 9141. P. 415-422.

5. Ivutin A.N., Larkin E.V., Lutskov Yu.I. Simulation of Concurrent Games in Distributed Systems // 2015 The 5th International Workshop on Computer Science and Engineering (WCSE 2015) - April 15-17, 2015. Moscow, Russia, 2015. P. 60 - 65.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Korolyuk V., Swishchuk A. Semi-Markov random evolutions. Sprin-ger-Science+Buseness Media, 1995. 309 p.

64

7. Larkin E.V., Lutskov Yu.I., Ivutin A.N., Novikov A.S. Simulation of concurrent process with Petri-Markov nets // Life Science Journal. 2014. N. 11 (11). P. 506 - 511.

8. Shiryaev A.N. Probability. Springer Science+Business Midia, 1996.

611 p.

9. Cleaveland R., Smolka S. Strategic directions in concurrency research // ACM Comput. Surv. 1996. Vol. 28, № 4.

10. Heymann M. Concurrency and Discrete Event Control // IEEE Control Syst. Mag. 1990. Vol. 10. P. 103-112.

11. Valk R. Concurrency in Communicating Object Petri Nets // Con-curr. object-oriented Program. petri nets. 2001. P. 164-195.

12. Dijkstra E.W. Cooperating sequential processes // Programming Languages, Academic Press, London, 1968. P. 43-112

13. Larkin E.V., Lutskov Yu.I., Ivutin A.N., Novikov A.S. Simulation of concurrent process with Petri-Markov nets // Life Science Journal. 2014. N. 11 (11). P. 506 - 511.

14. Larkin E.V., Ivutin A.N. Estimation of Latency in Embedded RealTime Systems // 3-rd Meditteranean Conference on Embedded Computing (MEC0-2014). 2014 June 15-19. Budva, Montenegro, 2014. P. 236 - 239.

15. Mark S. Squillante Stochastic Analysis and optimization of multiserver systems / Danilo Ardagna, Li Zhang (ed.) Run-Time Models for Self-managing Systems and Applications. Mathematic Subject Classification. Springer Based AG, 2010. P. 1 - 25.

16. Iverson M.A., Ozguner F., Follen G.J. Run-time statistical estimation of task execution times for heterogeneous distributed computing // Proc. 5th IEEE Int. Symp. HighPerform. Distrib. Comput. 1996. P. 263 - 270.

Ларкин Евгений Васильевич, д-р техн. наук, проф., зав. кафедрой, elarkinamail.ru, Россия, Тула, Тульский государственный университет

MULTISTAGE CONCURRENT GAMES E. V. Larkin

It is shown that multistage concurrent games, or relay-races, are widely used in practice. It is proposed to model relay-races in the state space, in which discrete co-ordinates are the mathematical analogue of stages, which participants pass in the current time, and basic principle of modeling of residence of participant in space states is the M-parallel semi-Markov process. With use the proposed formalisms formulae for evaluation of stochastic and time characteristics of relay-races evolution are obtained For arbitrary realization of switching trajectory the recurrent procedure of evolution with evaluation of stochastic and time characteristics of realization under investigation is worked out. Conception of distributedforfeit, which depends on difference of stages ofparticipants compete in pairs is introduced. Dependence for evaluation of total forfeit of every participant is obtained.

Key words: relay-race, concurrent game, M-parallel semi-Markov process, distance, stage, state space, evolution, distributed forfeit, trajectory realization, recurrent procedure.

i Надоели баннеры? Вы всегда можете отключить рекламу.