Научная статья на тему 'Равновесие в бескоалиционной игре n лиц с выбором момента времени'

Равновесие в бескоалиционной игре n лиц с выбором момента времени Текст научной статьи по специальности «Математика»

CC BY
231
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИГРА С ВЫБОРОМ МОМЕНТА ВРЕМЕНИ / РАВНОВЕСИЕ / ИГРА НА ИСТОЩЕНИЕ / ПРЕДСКАЗАНИЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ / GAME OF TIMING / N-PERSON GAME / EQUILIBRIUM / WAR OF ATTRITION / PREDICTION OF RANDOM VARIABLE

Аннотация научной статьи по математике, автор научной работы — Мазалов Владимир Викторович, Сакагучи Минору

В статье рассматривается игра n-лиц с выбором момента времени. В каждый момент времени игрок решает, сделать выстрел или нет. В терминах таких игр формулируются модели аукционов, игры на истощение, предсказания и др. Используя симметрию задачи, строится равновесие в данной игре.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Each player in the game of timing has to decide his time to shoot under the condition that he is not informed of the shooting times of his rivals. That is, we deal with silent games of timing. Games of timing are used to model auctions, games of war of attrition, competitive predictions of a random variable, etc. Using the symmetry of the model we derive the equation to determine the equilibrium of the game.

Текст научной работы на тему «Равновесие в бескоалиционной игре n лиц с выбором момента времени»

УДК 519.8 ББК 22.18

РАВНОВЕСИЕ В БЕСКОАЛИЦИОННОЙ ИГРЕ п ЛИЦ С ВЫБОРОМ МОМЕНТА ВРЕМЕНИ 1

Мазалов В. В. 2

(Учреждение Российской академии наук Институт прикладных математических исследований Карельского научного центра РАН, Петрозаводск )

Сакагучи М. 3 (Университет Осака, Япония)

В статье рассматривается игра п-лиц с выбором момента времени. В каждый момент времени игрок решает, сделать выстрел или нет. В терминах таких игр формулируются модели аукционов, игры на истощение, предсказания и др. Используя симметрию задачи, строится равновесие в данной игре.

Ключевые слова: игра с выбором момента времени, равновесие, игра на истощение, предсказание случайной величины.

Введение

Игры с выбором момента представляют собой важный раздел теории игр, определенных на компактных множествах. В терминах таких игр формулируются задачи, связанные с дуэлями, аукционами, играми на истощение и другие. Сложность таких задач в том, что равновесие достигается в смешанных стратегиях. Для нахождения равновесия здесь разработаны специальные методы

1 Текст приводится в соответствии с изданием «Математическая теория игр и ее приложения. - 2009. - Т. 1. №1».

2 Владимир Викторович Мазалов, доктор физико-математических наук, профессор(ута1а1оу@кге.кагеНа.ги).

3 Минору Сакагучи, доктор наук, профессор.

сведения игровой задачи к нахождению решения системы дифференциальных уравнений [1-2]. В литературе в основном были исследованы игры двух лиц. В данной работе мы исследуем бескоалиционные игры с выбором момента времени для п игроков. Вначале мы рассматриваем модели аукционов, затем дуэли, игры на истощение и, в завершение, игры, связанные с угадыванием случайной величины [3].

1. Аукционы

Задача, которую мы рассмотрим в этом параграфе, относится к моделям аукционов. Для простоты мы рассмотрим только симметричный случай, когда все п игроков находятся в одинаковых условиях. Итак, на аукционе выставлен некоторый предмет с одинаковой ценностью V для всех игроков и игроки одновременно объявляют цену за него, соответственно (Ж1, ...,хп). Тот из игроков, который объявил наивысшую цену, получает этот предмет. Существуют различные схемы аукционов. Мы рассмотрим две схемы аукционов: по первому и второму предложениям.

Аукцион по первому предложению. Предположим, что правила аукциона таковы, что победитель, т. е. игрок, назвавший максимальную цену, получает данный предмет и ничего не платит. Остальные игроки должны заплатить за участие в аукционе ту цену, которую они заявили. Если же несколько игроков заявили максимальную цену, они делят выигрыш поровну. Согласно данным правилам функция выигрыша в данной игре имеет вид

{-Хг, если Хг < у—,

- хЬ если хг = У—i,

V, если Хг > У-г,

где у-г = шах{х^} и тг(х) - число игроков, чьи предложения

3=г

совпали с хг, I = 1, ...,п. Нетрудно понять, что здесь нет равновесия в чистых стратегиях, будем искать его среди смешанных 56

стратегий. Пользуясь симметрией, можно проводить рассуждения только для первого игрока.

Предположим, что игроки {2, ...,п} используют одну и ту же смешанную стратегию с функцией распределения ^(х),х € [0, то). Выигрыш первого игрока зависит от распределения величины у—1 = шах{х2,..., хп}. Легко понять, что распределение этого максимума есть просто (п — 1)-я степень распределения ^(х), а именно *П_1(х) = Fп-1(х). Тогда, с вероятностью [^(х)]п-1 предложение первого игрока будет максимальным и он получит выигрыш V, и с вероятностью 1 — ^(х)]п-1 кто-то назовет большую цену и ему придется заплатить х. Теперь мы можем выписать выигрыш первого игрока, использующего чистую стратегию х

Я1(х,^ ... ^) = V[F(х)]п-1 — х (1 — [F(х)]п_^ =

= (V + х)^ (х)]п-1 — х.

Достаточным условием того, что профиль ^(х),...^(х)) будет образовывать равновесие, является условие

Последнее условие приводит к дифференциальному уравнению

с граничным условием Fn_l(0) = 0. Интегрирование дает

п_ 1

п_ 1

п_ 1

Н1(х, F, ••• , F) = сош£ или дН1(х, /дх = 0.

^п_1(х) = 1 — Fn_l(x)

^х V + х

Следовательно, оптимальная смешанная стратегия определяется следующим образом

Подставляя найденное распределение в (2), находим

Д1(х^ *, ••• ^ *) = 0 для любого х ^ 0. Таким образом, какую бы смешанную стратегию не использовал первый игрок, его выигрыш будет равен нулю. А это означает, что значение игры равно нулю.

Теорема 1. В аукционе с функцией выигрыша (1) равновесие образуют смешанные стратегии вида

а значение игры равно нулю.

Аукцион по второму предложению. Правила данного аукциона таковы, что все игроки должны заплатить за участие в аукционе названную цену, а выигравший игрок платит лишь цену второго по величине игрока. Аукционы, в которых победитель платит цену второго по величине предложения, называются аукционами Викри. Если несколько игроков сделали максимальное предложение, V распределяется на всех поровну.

а плотность данного распределения имеет вид

П— 1

Таким образом, функция выигрыша в данной игре имеет вид

{-Жг, если Xi < y-i,

mi - Xi, если Xi = y-i,

V - y-i, если Xi > y-i,

где y-i = max{xj} и mi - имеют то же значение, что и в пер-

j=i

вой модели. Здесь нет равновесия в чистых стратегиях. Если все предложения не превосходят V, следует пытаться максимально увеличить предложение, однако, если хотя бы одно предложение станет больше V, следует объявлять нулевую цену. Найдем равновесие в смешанных стратегиях, причем в силу симметрии проведем рассуждения только для первого игрока.

Предположим, что игроки {2, ...,n} используют одну и ту же смешанную стратегию с функцией распределения F(ж), ж G [0, то). Выигрыш первого игрока зависит от распределения величины y-i = max{x2,..., жп}. Мы отмечали выше, что распределение этого максимума есть просто (n — 1)-я степень распределения F(ж), а именно Fn-i(x) = Fn-i (ж). Теперь мы можем выписать выигрыш первого игрока, использующего чистую стратегию ж.

п-1 x СО

Hi(x, F~''~~F) = J(V - t)dFn-i(t) - J xdFn-i(t).

0 x

Поскольку носитель распределения F(ж) есть [0, то), то до-

n- i

статочное условие существования равновесия Hi (ж, F, ■ ■ ■ , F) =

n- i

const или дН^ж, F^—-Т^))/дж = 0 приводит к дифференциальному уравнению

^га-1(ж) _ 1 - ^га-1(ж)

^ж V ’

общее решение которого имеет вид

ж

Е„-1 (ж) _ 1 - сехр(-V).

Поскольку Е(0) _ 0 находим Еп-1(ж) _ 1 — ехр(-у). Теперь мы можем найти Е(ж)

(4) Е(ж)_ (1 — ехр(—V)) ^ .

Итак, если игроки {2, ...,п} используют смешанную стратегию Е(ж), то выигрыш первого игрока имеет постоянное значение

„—1 „—1

Н1(ж, Е, ■ - , Е) _ Н1(ж, Е, ■ - , Е') _ 0. Отсюда, какую бы стратегию не использовал первый игрок, его выигрыш в такой ситуации всегда будет равен нулю. А это означает оптимальность стратегий Е(ж).

Теорема 2. В аукционе с функцией выигрыша (3) равновесие образуют смешанные стратегии вида

1

Е(ж) _ (1 — ехР(—V)) П-1 .

Для п _ 2 плотность распределения (4) имеет вид /* (ж) _

V-1е-х/у, и для п ^ 3,

/*(Х 1 ^1 р-х/М "-1 -\ 1 р-х/^ / +ТО> ЄСЛИ Х і 0

^ п — IV У V \ 0, если х | то.

Интересно отметить, что хотя условия этих двух аукционов различаются незначительно, оптимальные стратегии имеют совершенно разный вид. В первом случае это степенная функция, а во втором - экспоненциальное распределение. Неожиданно оказывается, что обе оптимальные стратегии могут привести к предложениям, которые больше, чем ценность объекта V. В заключение сравним вероятности превысить данное значение V для обеих моделей аукционов для п _ 2. Для аукциона по первому предложению данная вероятность равна 1 — Е*^) _ 1 — (1/2)-1 _ 0.5, а для аукциона по второму предложению эта вероятность меньше

1 — Е*^) _ 1 — (1 — ехр(—1))1/(„-1) » 0.3679.

2. Игра на истощение

Существует другая биологическая интерпретация игры, рассмотренной в предыдущем параграфе. Эта модель близка к модели конкуренции среди животных в борьбе за ресурс V, которая была предложена английским биологом М. Смитом.

Предположим, что V _ V(ж), положительная и убывающая функция от ж, представляет собой некий ресурс на данной территории. За ресурс идет борьба между п животными (игроками) и время игры ограничено единичным интервалом. В течение какого-то времени ж^ € [0,1], г _ 1,...,п животные демонстрируют свою силу и то из них, которое делает это дольше всех, захватывает весь ресурс. При этом, затраты участников пропорциональны времени их затраченных усилий, а затраты победителя равны длине интервала времени, когда его последний конкурент покинул поле битвы.

Будем искать равновесие среди смешанных стратегий в виде функций распределения

где а некоторое значение из интервала [0,1] и /а индикатор собы-

61

тия А Предположим, что все игроки {2,..., п} используют одну и ту же стратегию Е, а первый игрок использует чистую стратегию ж € [0,1]. Его ожидаемый выигрыш равен

(5)

П— 1

#і(х, Е) =

( X

У(У (х) — ¿)й (Е (¿))га 1 — х| 1 — (Е (х))п ^ , если 0 ^ х<а

(У(х) — ¿) й(Е(^

П — 1

если а < х ^ 1,

где £ есть время прекращения борьбы второго по силе игрока. Пусть

(6) 3(х) = V(х) (Е(х))п 1, для 0 < х < а.

Тогда (5) можно представить для 0 < х < а,

а

X

Н1(ж,Е,... , Е) _ £(ж) — | ^ (Е (¿))га-1 — ж{ 1 — 0|)}_

о

(7)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

X

_ 3(ж) + ^ ^ — ж.

о

Условие _ 0 приводит к линейному дифференциальному уравнению

(8) 0'(х) + 0|х) = 1, с 3(0) =0

62

решение которого есть

(9) «.,,) = е- /-V-«Г1* [/ е/-V-«Г** + е

где с произвольная постоянная.

Предположим, например, V(х) = X, 0 ^ х ^ 1. Для этого случая находим

Q(x) = x

di/i + c

Lo

= x(— log x + c).

Из граничных условий Q(0) = 0 следует c = 0, следовательно,

(10) Q(x) = —x log x,

что дает вместе с (6)

(11)

F(x) = (— logx)«-1, 0 ^ x ^ a,

это возрастающая функция с F(0) = 0 и F(a) = ( — log a) .

Условие F(a) = 1 дает a = 1 — e-1 w 0,63212.

Для F(x) вида (8) выигрыш (5)-(7) первого игрока становится равным для 0 < x < a,

X

Hl(x’F’ •• -F > = —x log x+ /("log I)di—x = 0-

так как второе выражение в правой части равно x log x + x, как следует из соотношения f (1 + log i)di = — i log i.

Для a < x ^ 1, H1(x, F, • • • , F) согласно (5) является убывающей функцией от x.

Следовательно, если F*(x) выбрано так, как определено в (8), то

H1(F, F*, • • • , F*) < H1(F*, F*, • • • , F*) = 0,

X

V функции распределения F (x).

Окончательно, приходим к следующему утверждению. Теорема 3. В игре на истощение с ресурсом вида V (x) = x равновесие по Нэшу достигается среди смешанных стратегий вида

F *(x) = I (0 ^ x ^ a)(— log x) "=1 + I (a < x ^ 1),

с выигрышем для каждого игрока равным 0, где a = 1 — e-1(w 0,63212).

Например, для n = 2, оптимальная плотность /|(x) = (— log ж), а при n = 3

2х (— logХ)1/2 I е/2 ~ 1,359, если ж | а.

Их вид представлен на рис. 1. Интересно, отметить, что меняется радикально вид смешанных стратегий. Для п = 2 с большей вероятностью надо бороться за ресурс как можно дольше. При увеличении числа соперников следует с большой вероятностью сразу же покидать поле битвы.

Рассуждая аналогично, нетрудно получить более общий результат.

Теорема 4. Для V(ж) = 1Х, (0 < к ^ 1), равновесие по

к

Нэшу достигается среди смешанных стратегий вида Е*(ж) = [(к/к) {(Х)к-1 - і}] ^

где a есть единственный корень в интервале (0,1) уравнения

—k log a = — log k.

Оптимальный выигрыш каждого игрока равен 0.

64

n , (x)k-1 - 1 , -

Заметим, что iim ----------=-----= — log x и, следовательно,

fc^1-0 k

lim F*(x) = (— logx) h—> 1—0

1

n — 1

3. Дуэли, труэли и другие соревнования на меткость

Рассмотрим соревнования п игроков, связанные с поражением некоторой мишени (в частном случае своего противника). Каждый из игроков имеет одну пулю, которой он может выстрелить в цель в любой момент времени из интервала [0,1]. Стартуя в момент Ь = 0, он движется к своей цели, которую может достигнуть в момент Ь = 1, и в какой-то момент должен выстрелить в нее. Пусть А(Ь) есть вероятность поражения цели, если выстрел происходит в момент Ь € [0,1]. Предполагается, что А(Ь) дифференцируема и А'(Ь) > 0, А(0) = 0 и А(1) = 1.

Выигрыш игрока равен 1, если он поразил свою цель раньше,

65

чем другие игроки, и равен 0, в противном случае. В случае, если несколько игроков поразили цель, их выигрыш равен 0. Каждый игрок заинтересован найти такую стратегию, при которой математическое ожидание попадания в цель максимально.

В силу симметрии задачи, естественно предположить, что в равновесии все оптимальные стратегии игроков одинаковы. Предположим, что все игроки используют одинаковые смешанные стратегии с функцией распределения Е(Ь) и, соответственно, плотностью /(Ь),а ^ Ь ^ 1, где параметр а € [0,1]. Тогда, ожидаемый выигрыш первого игрока, если он стреляет в момент х, а другие игроки используют смешанные стратегии Е (Ь) равен

(12)

П— 1

#і(ж, І^^Р)

А(ж),

А(ж)

X

1 - I А(*)/(¿)^

если 0 ^ ж < а,

П— 1

так как для а ^ х ^ 1 игрок 1 получит выигрыш 1, только в случае, если все другие игроки 2 ~ п не стреляли, или стреляли до момента х, но не попали в цель.

Пусть V общий для всех игроков оптимальный выигрыш. Тогда достаточное условие для равновесия будет выглядеть так.

(13) Яі(ж,Е, ••• ,Е)

V, для

Для а ^ х ^ 1 дифференцируя (12) и приравнивая нулю, мы приходим к дифференциальному уравнению

(14)

/(ж)

2и - 1 и — 1

А'(ж) А" (ж)

А(ж) А'(ж)

Интегрирование от а до х дает

(15) откуда

(16)

/(х) = А'(х) / А(х) У /(а) А'(а) \А(а) /

2п —1 п — 1

2п —1

/(х) = с (А(х)) п—1 А (х)

Условие / / (¿)^Ь = 1 дает

1 I 2п — 1, /п — 1\

(17) с = (А(х)) 11—1 А(х)^х =(----------------J

(А(а))-п—1 - 1

Условие (13) на интервале а ^ х ^ 1 требует, чтобы выполнялось

А(х)

X

1 - / А(Ь)/(Ь)^Ь

п—1

= V,

которое приводит вместе с (14) после упрощений к равенству

11 с(п — 1) (А(а)) п—1 — (А(х)) п—1

(18)

1 — Vп-1 (А(х)) п-1 , Ух € [а, 1].

Исключая с в соответствии с (15), приходим к равенству

11 (А(а)) п -1 — (А(х)) п -1 =

1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

п

1

1 -|

п — 1

(А(а)) п—1 — 1 , Ух € (а, 1).

1

V

Следовательно, должны выполняться соотношения

п 1

(А(а)) п-1 — п (А(а)) п-1 — 1 = 0 и

п

(А(а))-п-1 — 1

(20)

1

V п-1

= п.

1 1 Из этих двух уравнений находим V п—1 = (А(а)) п—1, и

отсюда V = А (а).

Кроме того, умножая обе части первого уравнения (20) на

п

(А(а))п—1, приходим к уравнению

(21) (А(а)) п=1 + пА(а) — 1 = 0.

Окончательно, нам остается установить условие Д1(ж,Е, ••• , Е) ^ V, Уж Є [0, а]. А это выполняется, поскольку в силу предположений А(ж) ^ А(а) = V, Уж Є [0, а).

Данные рассуждения приводят нас к следующему утверждению.

Теорема 5. Пусть ап единственный корень на [0,1] уравнения

п

(22) ап—1 + па — 1 = 0.

Тогда равновесие по Нэшу в данной игре состоит из смешанных стратегий вида

1 , N 1 . ■ . NN 2П-1

п1

/ *(ж) =-7 (ап)п-1 (А(ж)) п-1 А (ж),

(23)

для А-1(ап) = ап ^ ж ^ 1.

При этом оптимальные выигрыши игроков в равновесии равны ап.

Мы видим, во-первых, что оптимальный выигрыш игроков ап не зависит от функции точности А(і), и, во-вторых, начальная точка носителя оптимальной стратегии а зависит от А(і). Кроме того, мы видим из (23), что вероятность ничьей, т. е. когда все

п

игроки получают нуль равна (ап)п-1.

68

При п = 2 (дуэль) ожидаемый выигрыш равен ап = л/2 — 1 и

0,4142, а при п = 3 (труэль) ап и 0,2831. Интервал носителя распределения зависит от вида функции точности.

Пример 1. Пусть А(ж) = ж7,7 > 0. Тогда

а„ = А 1(а„) = аЦ1

и оптимальная стратегия имеет следующую плотность распределения

/*(ж) = —(ап)п-1 ж-(п-17+1), для аП/т ^ ж ^ 1. п1

При 7 = 1 и п = 2(дуэль) ап = ап = \/2 — 1, т. е. начинать стрелять надо после момента 0,4142. Заметим, что для любого п ^ 2, ап возрастает, когда параметр 7 возрастает. Это соответствует интуитивному ожиданию, что чем меньше меткость игрока, тем позже надо начинать стрелять. •

ех — 1

Пример 2. Пусть А(ж) =-------------. Тогда

----------- е — 1

ага = А-1(а„) = 1с£ {1 + (е — 1)а„} ,

следовательно, ап убывает, если п возрастает. Например, при п =

2 (дуэль)

а„ = 1с^(^2 — 1)(е + л/2)| и 0,5375, а при п = 3 (труэль)

ап и 0,3964.

При этом оптимальные стратегии определяются с помощью плотности распределения вида

1 2п-1

/*(ж) = й-г (ап)^ (е — 1)-1 (ех — 1)-2п-1 ех, для ап ^ ж ^ 1. •

4. Игра предсказания

Представим, что п игроков стараются предсказать значение и случайной величины и, которая имеет равномерное распределение С/[0,1] на интервале [0,1]. Правила игры таковы, что выигрывает тот игрок, который назвал значение, ближайшее к и, но не большее его. При этом он выигрывает единицу, а остальные п — 1 игроков получают 0. Каждый из игроков стремится максимизировать ожидаемый выигрыш.

Будем искать равновесие в виде распределений с носителем на некотором интервале [0, а], а ^ 1, а именно пусть

Тогда ожидаемый выигрыш игрока 1, если его предсказанное значение равно ж, а другие игроки следуют смешанной стратегии с функцией распределением С(£) и ее плотностью $(£), равен

поскольку к игроков (1 ^ к ^ п — 1) могут назвать значения большие, чем ж, а другие п — 1 — к игроков назвать меньше, чем ж. Заметим, что плотность распределения случайной величины

X

С(ж) = I(ж < а) / + I(ж ^ а).

о

п— 1

(24) Н1(ж, С, ■ ■ ■ , С) = ж, если а < ж < 1.

Для 0 < ж < а согласно условиям

шіп(Хі, ■ ■ ■ , ) есть к (С(і))к 1 д(£).

70

Поскольку интегрирование по частям приводит к равенству

а а

!(£ — ж) (С(£))к 1 ^(^)^^ = 1У (С(^))к ^

X X

мы можем переписать (25) в виде

п-1

Н (ж, С”^С) =

(26) п—, . , . а

(С(ж))п—1 ж + пк )(С(ж))п-1-‘у (С(г))кл,

для 0 < ж < а. Пусть V оптимальное ожидаемое значение выигрыша каждого игрока. Запишем условие смешанного равновесия

для С(ж)

<27» Н‘(ж.°.■■■ ;}V. для {а<ж< 1

Пользуясь (26)-(27), преобразуем уравнение

дхJ

дх Н1(ж,^, ••• ,#) = 0 на интервале 0 ^ ж < а. Деля обе

части уравнения на (С(ж))п 1 и упрощая, приходим к уравнению

1 + V ( п — М ( С(ж) V = #(ж)

+ ¿Л 01с(ж^ С(ж)

(п — 1)ж+

+ £ ( " к 1 ) (” — 1 — к)/Ш!)

Левая часть уравнения (28) равна [С(ж)] (п 1) , а правая часть может быть представлена как

д(ж)

С(ж)

(п - 1)

а +

1 + .М. Г-2

+ с(ж);

Таким образом, мы можем представить (28) в виде

а[С(ж)]га 2 + I (С(ж) + С(£))га 2^і = [(п — 1)д(ж)]

га— 2,

1-1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(29)

0 < ж < а, Уп ^ 2.

Естественно ^(ж), С(ж) и а зависят от п. Но мы для простоты опускаем индекс п.

Рассмотрим последовательность функций

«к(ж) =

(30)

а[С(ж)]к + (С(ж) + С(і))к ^

ж,

Ук = 1, 2, ••• ,п — 2. Очевидно, выполняются неравенства

(31) 1 = «0(ж) ^ «1(ж) ^ «2(ж) ^••• ^ «п-2(ж) ^ 0, Уж є [0,а]. Умножая обе части (30) на ж и дифференцируя, приходим к

рекуррентным дифференциальным уравнениям

ж«*. (ж) — (ж) = кд(ж)ж«к-1(ж) — 1,

или, эквивалентно,

(32) «к (ж) + (1 — (ж)) /ж = кд(ж)«к-1(ж), Ук = 1,2, ••• , п—2 с граничными условиями

а

а

а

(а) = 1, Ук = 1,2, ■ ■ ■ , п — 2.

Из (29)-(30) мы видим

(33)

«п-2(ж) = [(п - 1)Ж#(Ж)] 1

что эквивалентно

д(ж) = [(п - 1)ж5п-2(ж)] 1 ^ [(п - 1)ж] 1 (из (31))

Среднее значение этого распределения равно

а

а

(34)

У жд(ж)^ж =

ж^ж

(п - 1)ж«п-2(ж)‘

0

0

Теорема 6. Пусть («1, ••• ,8га-2} есть решение системы

берем а из условия / д(ж)^ж = 1. Тогда д(ж) оптимальная сме-

шанная стратегия в игре предсказания.

Система (32) вместе с (33) может быть использована для нахождения решения задачи. Опишем этот алгоритм. Вначале фиксируем значение параметра а, и рассматриваем систему дифференциальных уравнений (32) на интервале [0, а]. Когда найдем решение с граничным условием •§&(а) = 1, к = 1, ■ ■ ■ , п - 2, определяем плотность распределения 5(ж) = [(п - 1)зп-2(ж)(1 - ж)]-1, ж Є [0, а]. Затем вычисляем а

дифференциальных уравнений (32) и д (ж)

а

0

а

из условия д(ж) = 1. 0

Случай п = 2.

Из (24)-(26) следует

ж, для а < ж < 1.

С(ж)ж + (£ - ж)д^)^, для 0 < ж < а

Уравнение (29) дает для 0 < x < a,g(x) = 1/x, и отсюда G(x) =

— logХ, a = 1 — e-1 w 0,63212. Для a < x < 1, имеет место Hi(x,g*) = x ^ a = H1(a,g*) и, следовательно, условие (27) удовлетворяется. Общее значение игры равно e-1 ~ 0,36788.

Случай n = 3.

(35) Hi(x,G,G) =

(G(x))2 x + 2G(x) I (t — x)g(t)dt+

= <

+2 /(£ — ж)С(^д^)^, если 0 < ж < а

X

ж, если а < ж < 1.

Уравнение (32) для п = 3 приводит к дифференциальному уравнению

(36) 51(ж)+(1 — «1(ж))/ж = д(ж)50(ж)= д(ж), при этом «1(а) = 1, и после упрощения

xsi(x) = aG(x) + J (G(x) + G(t)) dt =

(37) x

= ш(из (29) при n =3)-

a

Исключая д(ж) из (36)-(37), приходим к дифференциальному уравнению

51 5^ 1

(38) 1—1 = =, 0 < ж < а, с 51(а) = 1.

— §1 + 2 ж

Функция д(ж) = (2§1(ж)ж)-1 является положительной и непрерывной и представляет плотность распределения, если 74

а

/ д(ж)^ж = 1. Отсюда

о

а а

1 = J з(ж)^ж = J/й^ж) +

иж

а

= 1 — 81(0) + I

1 — 81(ж) ¿ж

1 — ж о

так что

а 1

81(0) = / 1 , 81(ж) ^ж = / 2 8181—1 ^1 (из (38))

J 1 — ж J 8-1 — Й1 + 12

о 51(0) 2

— —1 + 81(0) + 4 — tan 1(2в1(0) — 1)

так как [ —2——---= 2 tan 1 2ж

7 82 — 81 + Г2

и поэтому

(39) 81(0) = 1 {1 — tan(l — 0} и 0,3910.

Кроме того, интегрируя обе части (38) от ж до а, мы приходим к уравнению

1

(40) ^2 — 81 + 0 2 е1ап 1(251-1) = —еп/4а/ж.

Подставляя здесь ж = 0 и используя 81(0) и 0,3910, получаем

1/2

(41) а = 1 — |2 (81(0))2 — 281(0)+ 1} е-1 и 0,7156.

Условие (27) выполняется согласно (35) с V = а = 0,2844. Решения для п = 2 и п = 3 изображены на рис. 2.

Рис. 2. Решения для п = 2 и 3 Случай п = 4.

Из (24)-(26) для п = 4 имеем (42) Я1(ж,С,С,С,С) =

(С(х))3х + ^ ^ 3 ^ (С(х))3 к ! (^(¿))к ^¿, 0 < х < а

х,

а < х < 1.

Система (32)-(33) становится

(43)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

' «1(х) + (1 - 5і(х)) /х = д(х)«о(х) = д(х), с $і(0) = 1 4(х) + (1 - $2(х)) /х = 2д(х)«і(х), с §2(0) = 1

™л-1

«г

Плотность распределения имеет вид д(ж) = (3ж«2(ж)) 1, и

(х) ‘

а

мы можем выбрать а так, что 1 = / • Так как правая часть

0

^ 2 Г

есть ^ д J 2т5 (т), мы можем использовать решение для случая

п = 3.

Исключая д(ж) из (43), получаем простое дифференциальное уравнение

{«1 (ж) + (1 — 51(ж)) /ж = (3ж82(ж))-1 _ _

«2(ж) + (1 — «2(ж)) /ж = 3«і(ж)/ (ж«2(ж)) .

После вычислений находим а ~ 0,7917. Условие (27) выполняется с V — а 0,2083.

Другие примеры.

Для случаев п ^ 5 вычисления приводят к следующим результатам

= 2; а ^ 0,6321, V ^ 0,3679, / жд(ж)^ж ^ 0,3678 п

3; 0,7156, 0,2844,

4; 0,7917, 0,2083,

5; 0,8286, 0,1714, 0,4251

7; 0,8731, 0,1269, 0,4425

10; 0,9084, 0,0916, 0,4573

Мы видим, что когда п возрастает, а | 1, оптимальные выигрыши | 0, и в равновесии плотности распределения асимптотически становятся равномерными распределениями С/[0,1] •

Литература

1. КАРЛИН С. Математические методы в теории игр, программировании и экономике. - М.: Мир, 1964.

2. ПЕТРОСЯН Л.А., ЗЕНКЕВИЧ Н.А., СЕМИНА Е.А. Теория игр. - - М: Высшая школа, 1998.

3. SAKAGUCHI M., SZAJOWSKI K. Competetive prediction of a random variable

Math. Japonica. - 1996. - V. 34. №3. P. 461-472.

EQUILIBRIUM IN n-PLAYER COMPETITIVE GAME OF TIMING

Vladimir Mazalov, Institute of Applied Mathematical Research Karelian Research Center of RAS, Doctor of Science, professor (vmazalov@krc.karelia.ru).

Minoru Sakaguchi, Osaka University, Doctor of Science, professor

Abstract: Each player in the game of timing has to decide his time to shoot under the condition that he is not informed of the shooting times of his rivals. That is, we deal with silent games of timing. Games of timing are used to model auctions, games of war of attrition, competitive predictions of a random variable, etc. Using the symmetry of the model we derive the equation to determine the equilibrium of the game.

Keywords: game of timing, n-person game, equilibrium, war of attrition, prediction of random variable.

i Надоели баннеры? Вы всегда можете отключить рекламу.