Научная статья на тему 'Об одном подходе к решению антагонистических игр с большим количеством чистых стратегий игроков'

Об одном подходе к решению антагонистических игр с большим количеством чистых стратегий игроков Текст научной статьи по специальности «Математика»

CC BY
204
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
антагонистическая игра / компьютерное моделирование / оптимальные смешанные стратегии / antagonistic game / computer modeling / optimal mixed strategy

Аннотация научной статьи по математике, автор научной работы — Анищенкова Надежда Геннадьевна, Болотин Иван Борисович

В данной работе рассматривается один из возможных способов нахождения оптимальных смешанных стратегий при решении антагонистических игр с большим количеством чистых стратегий у игроков. Он состоит из двух этапов: компьютерного моделирования игры для построения гипотезы и доказательства теорем, сформулированных на основе построенной гипотезы. Для построения гипотезы используется одна из систем компьютерной математики.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Анищенкова Надежда Геннадьевна, Болотин Иван Борисович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

An approach to solving antagonistic games with a large number of pure strategies of the players

In this paper we consider one of the possible ways of finding the optimal mixed strategies for solving antagonistic games with a large number of pure strategies of the players. It consists of two stages: computer simulation of the game for constructing hypotheses and proofs of theorems formulated on the basis of the hypothesis. To construct hypotheses we use one of the systems of computer mathematics.

Текст научной работы на тему «Об одном подходе к решению антагонистических игр с большим количеством чистых стратегий игроков»

Об одном подходе к решению антагонистических игр с большим количеством чистых стратегий игроков

Н.Г. Анищенкова, И.Б. Болотин

Аннотация — В данной работе рассматривается один из возможных способов нахождения оптимальных смешанных стратегий при решении антагонистических игр с большим количеством чистых стратегий у игроков. Он состоит из двух этапов: компьютерного моделирования игры для построения гипотезы и доказательства теорем, сформулированных на основе построенной гипотезы. Для построения гипотезы используется одна из систем компьютерной математики.

Ключевые слова — антагонистическая игра,

компьютерное моделирование, оптимальные смешанные стратегии.

I. Введение

В учебных курсах университетов «Теория игр», «Исследование операций» в качестве примера парной антагонистической игры приводят известную игру «двухпальцевая Морра». Наиболее распространенная ее формулировка имеет следующий вид [1].

В игру играют двое игроков. Каждый из них показывает один или два пальца на одной своей руке, перед этим каждый игрок высказывает версию, чему будет равно количество пальцев, показанных соперником. Если какой-то из игроков угадывает верно, а его соперник ошибается, то победитель получает количество очков, равное сумме показанных игроками пальцев. В противном случае игра заканчивается ничьей.

Двухпальцевая игра Морра имеет различные модификации. Данная работа посвящена исследованию обобщения игры, предложенной в [2]. В игру играют двое игроков. Каждый из них показывает один, два или три пальца. Если сумма количества показанных пальцев четна, то первый игрок получает количество очков, равное сумме количества показанных пальцев обоими игроками. В противном случае второй игрок получает количество очков, равное сумме количества показанных пальцев обоими игроками.

Замечание. Как отмечено в [1], увеличение количества

Статья получена 23 июня 2016.

Анищенкова Надежда Геннадьевна - кандидат физико-математических наук, доцент, заведующая кафедрой математики и информатики ФГБОУ ВО «Смоленский государственный университет», <nadezhdaadhzedan @ gmail.com>

Болотин Иван Борисович - кандидат физико-математических наук, доцент,декан физико-математического факультета ФГБОУ ВО «Смоленский государственный университет», <IBBolotin@smolgu.ru>

чистых стратегий игроков приводит к существенному усложнению анализа игр.

II. Постановка задачи

Рассмотрим следующую игру. В игру играют двое игроков. Каждый из них называет любое натуральное число от 1 до п (п > 2). Если сумма названных чисел четна, то первый игрок получает количество очков, равное сумме названных чисел. В противном случае второй игрок получает количество очков, равное сумме названных чисел.

В дальнейшем сформулированную игру будем называть видоизмененной игрой Морра.

В данной игре каждый из игроков имеет по п чистых стратегий - назвать одно из натуральных чисел от 1 до п.

Платежная матрица рассматриваемой игры имеет вид:

А =

2

- 3

-3

(-1)"« (-1)"+1 (n +1)

(- Г(" +1) (-1)" (n + 2)

(- 1)"n (- 1)n+1 (n +1)

(- Г(п +1) (-1)" (n + 2)

2n - 2 (- 1)(2n -1) (- 1)(2n -1) 2n

Пусть р = (р1, р2,..., рп) - смешанная стратегия первого игрока и V - цена игры, тогда математическая модель данной игры для первого игрока имеет вид:

£ (-1)'+J (i+j ) p, > v,

i=1

£ p,=1 (1)

i=1

Pi > 0, j = 1,2,...,n, z = v ^ max . (2)

Таким образом, требуется определить значения переменных р1,р2,..., рп,V , удовлетворяющих системе ограничений (1) и обращающих в максимум функцию (2).

Аналогично, пусть q = (^1, q2,..., ) - смешанная стратегия второго игрока и V - цена игры, тогда математическая модель данной игры для второго игрока имеет вид:

4

I (-1)'+j (i+jк * v,

j=i

■I kj =1 (3)

j=i

kj > 0 i = 1,2,...,n,

z = v ^ min . (4)

Таким образом, требуется определить значения переменных q1; q2,..., qn, v, удовлетворяющих системе ограничений (3) и обращающих в минимум функцию (4).

III. Компьютерное моделирование видоизмененной игры МОРРА

Для исследования данной игры при различных значениях параметра n воспользуемся системой компьютерной математики Wolfram Mathematica.

Программа в СКМ Wolfram Mathematica

Зададим наибольшее число, которое может назвать каждый из игроков. n = 100;

Построим платежную матрицу игры. A = Table[If[Mod[i + j, 2] == 0, i + j, -(i + j)], {i, 1, n}, {j, 1, n}];

Найдем нижнюю цену игры. а = Max[Table[Min[Part[A, i]], {i, 1, n}]] Найдем верхнюю цену игры. ß = Min[Table[Max[Part[A, All, j]], {j, 1, n}]]

Зададим смешанную стратегию первого игрока. P = Array[p, n];

Построим математическую модель игры для первого игрока.

Зададим систему ограничений (2).

Cond1 = Table[Part[A, All, j].P >= v, {j, 1, n}];

Cond2 = Table[P[[j]] >= 0, {j, 1, n}];

Cond3 = {Sum[P[[j]], {j, 1, n}] == 1};

Conds = Join[Cond1, Cond2, Cond3];

Найдем решение игры для первого игрока.

Var = Join[P, {v}];

M1 = Maximize[{v, Conds}, Var]

Цена игры равна:

M1[[1]]

Определим активные чистые стратегии, которые использует первый игрок в своей оптимальной смешанной стратегии, и их количество. Col1 = n;

S1 = Table[0, {i, 1, 0}]; Prob1 = Table[0, {i, 1, 0}];

Do[P[[i]] = P[[i]] /. M1[[2, i]]; If[P[[i]] == 0, Col1 = Col1 - 1, {S1 = Join[S1, {i}], Prob1 = Join[Prob1, {P[[i]]}]}], {i, 1, n}];

Количество активных чистых стратегий равно Col1

Активные чистые стратегии имеют вид S1 // MatrixForm

Вероятности использования активных чистых стратегий соответственно равны Prob1 // MatrixForm

Зададим смешанную стратегию второго игрока. Q = Array[q, n];

Построим математическую модель игры для второго игрока.

Зададим систему ограничений (4). Cond1 = Table[Part[A, j].Q <= v, {j, 1, n}]; Cond2 = Table[Q[[j]] >= 0, {j, 1, n}]; Cond3 = {Sum[Q[[j]], {j, 1, n}] == 1}; Conds = Join[Cond1, Cond2, Cond3]; Найдем решение игры для второго игрока. Var = Join[Q, {v}]; M2 = Minimize[{v, Conds}, Var] Цена игры равна: M2[[1]]

Определим активные чистые стратегии, которые использует второй игрок в своей оптимальной смешанной стратегии, и их количество. Col2 = n;

S2 = Table[0, {i, 1, 0}]; Prob2 = Table[0, {i, 1, 0}];

Do[Q[[i]] = Q[[i]] /. M2[[2, i]]; If[Q[[i]] == 0, Col2 = Col2 - 1, {S2 = Join[S2, {i}], Prob2 = Join[Prob2, {Q[[i]]}]}], {i, 1, n}];

Количество активных чистых стратегий равно Col2

Активные чистые стратегии имеют вид S2 // MatrixForm

Вероятности использования активных чистых стратегий соответственно равны Prob2 // MatrixForm

Оптимальные смешанные стратегии игроков и цена игры видоизмененной игры Морра, полученные результате работы программы при различных значениях параметра n приведены в таблицах 1 и 2.

Таблица 1

n Нижняя цена игры Верхняя цена игры Цена игры Активные чистые стратегии первого игрока Вероятность применения активных чистых стратегий

2 -3 2 1 12 1, 2 7 5 12 , 12

3 -3 4 0 1, 2, 3 1 1 1 4 , 2 , 4

4 -5 4 0 1, 2, 3 1 1 1 4 , 2 , 4

5 -5 6 0 1, 4, 5 1 1 3 ^ 2 , 8

6 -7 6 0 1, 2, 5 3 1 1 8 , 2 , 8

100 -101 100 0 1, 2, 99 97 1 1 196 , 2 , 96

101 -101 102 0 1, 100,101 1 1 99 200 , 2 , 200

Таблица 2

n Нижняя цена игры Верхняя цена игры Цена игры Активные чистые стратегии второго игрока Вероятность применения активных чистых стратегий

2 -3 2 1 - 12 1, 2 7 5 12 , 12

3 -3 4 0 1, 2, 3 1 1 1 4 , 2 , 4

4 -5 4 0 1, 2, 3 1 1 1 4 , 2 , 4

5 -5 6 0 1, 4, 5 1 1 3 8 , 2 , 8

6 -7 6 0 1, 2, 5 3 1 1 2 , 8

100 -101 100 0 1, 2, 99 97 1 1 196 , 2 , 96

101 -101 102 0 1, 100,101 1 1 99 200 , 2 , 200

2k -1

- соответственно;

2) п = 2к + 2, к е N, то активными чистыми стратегиями каждого из игроков будет выбор

л о о, , 2к -1 1

чисел 1, 2 и 2к +1 с вероятностями -, — и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4к 2

4k

соответственно.

2k +1 2k -1

4k

2

- соответственно;

Анализ данных, полученных в таблицах 1 и 2, позволяет сделать следующее предположение.

Гипотеза. При п > 3 цена видоизмененной игры Морра равна 0, а выбор поведения каждого из игроков зависит от четности наибольшего числа, которое могут называть игроки. При этом, если: 1) п = 2к +1, к е N, то активными чистыми стратегиями каждого из игроков будет выбор

чисел 1, 2к и 2к +1 с вероятностями —, 1 и

4к 2

IV. Решение видоизмененной игры Морра

Докажем, что найденные с помощью математического моделирования смешанные стратегии являются оптимальными, т.е. справедлив следующий основной результат.

Теорема. При п > 3 цена видоизмененной игры Морра равна 0, а выбор поведения каждого из игроков зависит от четности наибольшего числа, которое могут называть игроки. При этом, если:

1) п = 2к +1, к е N, то активными чистыми стратегиями каждого из игроков будет выбор чисел 1, 2к и

11

с вероятностями

2) п = 2к + 2, к е N, то активными чистыми стратегиями каждого из игроков будет выбор чисел

1, 2 и 2k +1 с вероятностями

2k -1 4k :

11

— и — 2 4k

соответственно. Доказательство. Для доказательства

сформулированной теоремы воспользуемся свойствами решения игры [1], а именно, если платежная матрица игры имеет вид А = (ац) и цена игры равна V, то

* / * * * \

смешанные стратегии р =(р1, р2, ..., рп) и

* ( * * * \

q =(^1, q2, ..., qn) являются оптимальными стратегиями для игроков тогда и только тогда, когда для всех • = 1,2,..., п и у = 1,2,..., п выполняются неравенства

£-v - £ajP* ■

(5)

j=1

Пусть n = 2k +1, k e N ■ Тогда получим

£ aq = (- Г (i +1) -k + (- IP (i + 2k ) 1 +

j=1

+ (-1)'+2k+1 (i + 2k +1)

2k -1

4k

1 i i 1 i

, У+1 I i 1 i,i, 1 i 1 1 In

= (-1) I— +----k + — + k +-------I = 0;

^ 4k 4k 2 2 2 4k 2 4k )

£ Ujp* = (- 1)1+j (1 + j ) ^ + (- 1Г (2k + j ) 1 +

+ (-1)2k+1+j (2k +1 + j )

2k -1 4k

= (-1)1+у (±- к - у+к+1+у -1 --!-У 1 = 0.

^ 4к 4к 2 2 2 2 4к 4к) Таким образом, неравенство (5) примет вид: 0 < V < 0 . Значит, цена игры в данном случае равна 0, и указанные смешанные стратегии являются оптимальными.

Пусть п = 2к + 2, к е N. Тогда получим

£ а¡д* = (- Г (,• +1)^ + (- Г (I + 2)+

j=1

2

+ (- 1)i+2k+1 (i + 2k +1)— = 4k

Г 1V+1Î * * 1 1 * 1 * 1 1 In

= (-1) I---+------1 + — + — + — I = 0;

M 2 4k 2 4k 2 4k 2 4k J

£ a^p* = (- Г (1 + j ) + (- 1Г (2 + j ) 2 + + (- 1Г+j (2k +1 + j ) 4k =

1

= (-1)1++1 -±1 -1+1+^+^ I=0. ^ 2 2 4к 4к 2 2 4к 4к)

Таким образом, неравенство (5) примет вид: 0 < V < 0 . Значит, цена игры в данном случае равна 0, и указанные смешанные стратегии являются оптимальными.

Теорема полностью доказана.

Замечание. Из доказательства теоремы видно, что для любого натурального п (п > 3) каждый из игроков должен использовать ровно три своих чистых стратегии. Замечание. При п = 2 видоизмененная игра Морра

1

является нечестной, так как ее цена равна - —.

j 1 1

V. Заключение

Использование системы компьютерной математики МаШета1ка позволило:

- выполнить моделирование одной из

антогонистических игр с нулевой суммой, в которой каждый из игроков имеет большое количество чистых стратегий;

- сформулировать гипотезу о наличии и виде

оптимальных смешанных стратегий игроков. Полученная гипотеза была полностью обоснована с использованием строгих математических выкладок.

Библиография

[1] Аллен Р. Математическая экономия. - М.: Издательство иностранной литературы, 1963.

[2] Афанасьев М.Ю., Багриновский К.А., Матюшок В.М. Прикладные задачи исследования операций: Учеб. пособие. -М.: ИНФРА-М, 2006.

An approach to solving antagonistic games with a large number of pure strategies of the players

N.G. Anishchenkova, I.B. Bolotin

Abstract — In this paper we consider one of the possible ways of finding the optimal mixed strategies for solving antagonistic games with a large number of pure strategies of the players. It consists of two stages: computer simulation of the game for constructing hypotheses and proofs of theorems formulated on the basis of the hypothesis. To construct hypotheses we use one of the systems of computer mathematics.

Keywords — antagonistic game, computer modeling, optimal mixed strategy.

i Надоели баннеры? Вы всегда можете отключить рекламу.