Научная статья на тему 'Обратная задача для антагонистической 3 х 3 игры с различными элементами платёжной матрицы'

Обратная задача для антагонистической 3 х 3 игры с различными элементами платёжной матрицы Текст научной статьи по специальности «Математика»

CC BY
153
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНТАГОНИСТИЧЕСКАЯ ИГРА / ОБРАТНАЯ ЗАДАЧА / ПЛАТЁЖНАЯ МАТРИЦА / ВЕРОЯТНОСТИ ВЫИГРЫШЕЙ / ANTAGONISTIC GAME / INVERSE PROBLEM / PAYOFF MATRIX / WIN PROBABILITY

Аннотация научной статьи по математике, автор научной работы — Верещагина Евгения Игоревна

Рассматривается обратная задача для 3 х 3 антагонистической игры двух игроков. Предполагается, что платёжная матрица имеет различные элементы. Также предполагается, что вероятности выигрышей известны. Показывается, что все решения обратной задачи получаются из одного из них перестановкой строк, столбцов и перестановкой выигрышей, имеющих одинаковую вероятность.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Обратная задача для антагонистической 3 х 3 игры с различными элементами платёжной матрицы»

УДК: 519.81/.83

Е.И. Верещагина

ОБРАТНАЯ ЗАДАЧА ДЛЯ АНТАГОНИСТИЧЕСКОЙ 3 х 3 ИГРЫ С РАЗЛИЧНЫМИ ЭЛЕМЕНТАМИ ПЛАТЁЖНОЙ МАТРИЦЫ

Нижегородский государственный технический университет им. Р.Е. Алексеева

Рассматривается обратная задача для 3 х 3 - антагонистической игры двух игроков. Предполагается, что платёжная матрица имеет различные элементы. Также предполагается, что вероятности выигрышей известны. Показывается, что все решения обратной задачи получаются из одного из них перестановкой строк, столбцов и перестановкой выигрышей, имеющих одинаковую вероятность.

Ключевые слова: антагонистическая игра, обратная задача, платёжная матрица, вероятности выигрышей.

Под обратной задачей в теории тх п - игр двух лиц, автор, как и в [1], понимает задачу восстановления платёжной матрицы А = (а^ ) по известному множеству Ы Ьг>. е В}, где

Ь - частота (вероятность) появления выигрыша агу. Если р (соответственно qj) вероятность выбора первым игроком 1-й стратегии (соответственно у-й вторым), то Ьг> = Piqj ■ Предполагается, что игроки применяют смешанные стратегии, и все чистые стратегии используются с положительными вероятностями (Ь^ ^ 0). Однако последнее ограничение несущественно, так как стратегии с нулевыми вероятностями (т.е. не используемые игроками) можно исключить из рассмотрения и игра сведётся к меньшим значениям т и п.

Эта задача моделирует следующую ситуацию. Проводится достаточно длинная серия игр, в которой сторонний наблюдатель имеет возможность получить информацию об исходе каждой игры. Будем предполагать, что все выигрыши различны. В этом случае статистика позволяет найти вероятности Ьгу каждого из них. Таким образом, становятся известными вероятности появления выигрышей, а также сами выигрыши.

Основные вопросы при изучении обратной задачи являются стандартными. Это вопросы существования решений (I), их единственности (II) и методов нахождения решений (Ш).

I. Поскольку речь идёт о восстановлении платёжной матрицы А, то мы заранее предполагаем, что решение существует.

Итак, мы исходим из какого-либо решения т х п - игры

A =

12

a

in

a21 a22

aa

V mi m2

a

2n

a

mn J ± m

Pi P 2

ql q2 ■■■ qn

с известной матрицей вероятностей В = (Ьг>). Конечно, по матрице В вероятности выбора стратегий р и qJ легко определяются: р Ьг> , ^ = 2 Ь ( = 1п, ] = 1, п).

Любое другое решение задачи о восстановлении платёжной матрицы А' = (а'у) от-

© Верещагина Е.И., 2012.

личается от исходного перестановкой элементов матрицы А: а', ., = аг>. где (,, 7', 7') -биекция.

В матрице вероятностей В' = (ъ, ) = (р.,), конечно же Ъ'{ ., = Ъг>. = Р^у ■ Следовательно, можно записать

т, - = РА, ■

(1)

Данное уравнение будем называть основным уравнением обратной задачи. Логарифмирование обеих частей уравнения (1) даёт

X + У, = X ' + У '>

(2)

где х, = 1п р,, у, = 1п qj, X, , = 1п Р,, и У}, = 1п ^,.

Это соотношение можно рассматривать как однородную систему уравнений относительно х, у, X и У, если временно не обращать внимания на условия нормировки

^ Р ^ р = 1. Их выполнения можно добиться после решения (2), вводя

подходящий нормирующий множитель в экспоненты.

Запись В = (Ъ ), где Ъ = Рiqj будем называть мультипликативной. Имея в виду работу с (2) представляется более удобным использовать аддитивную форму записи: В = (1п рд^) = (хг + у.). Заметим, что использование одной и той же буквы В в аддитивной и

мультипликативной записи вряд ли послужит причиной недоразумения.

Сделаем одно важное замечание относительно решений системы (2). Теорема 1: Основное уравнение обратной задачи инвариантно относительно преобразования х ^ X + а, у . ^ у . + Ъ, X' ^ X' + с, У/ ^ У+ й, где а, Ъ, с, й подчинены единственному ограничению а + Ъ = с + й. Доказательство:

Рассмотрим аддитивную В = (хг + у .) и мультипликативную В = (ех+у7) форму записи матрицы вероятностей В ■

При преобразовании хг ^ хг + а, у . ^ у . + Ъ матрица вероятностей В примет вид:

для аддитивной записи В = (хг + у + а + Ъ), для мультипликативной записи В = е+У1 ■ еа+ь).

Учитывая условие нормировки ^р qJ р, , = 1, введём нормирую-

щий множитель, знаменатель которого есть сумма всех элементов матрицы:

В =-1-(ех + у, Ц-1-(ех + у, ■ еа+Ъ )=-1-(ех+^)

^ех' +у7 ^ ' ^ех' +у7 еа + +у7

Доказательство для матрицы вероятностей В содержит аналогичные рассуждения. Таким образом, нетрудно видеть, что решение обратной задачи останется тем же самым.

Замечание: При решении системы (2) теорема позволяет уменьшить количество параметров системы на три.

II. Вопрос о том, с какой точностью определяется решение, представляется гораздо более интересным. Сразу же надо отметить, что решение обратной задачи не единственно. Так, например, перестановки строк (столбцов) в А дают другие решения обратной задачи.

Любое решение задачи о восстановлении платёжной матрицы А' = (а,) можно описать подстановками: аг> ^ а,. Свяжем с каждой игрой G некоторое множество Sub(G) подстановок, соответствующих всем решениям обратной задачи. Множество Sub(G) есть неко-

торое подмножество симметрической группы SN , где N = mn для m х n - игры.

Особо отметим некоторые решения, получаемые из исходного. Во-первых, это решения, где A' получается из A перестановкой строк и столбцов, это равносильно изменению нумераций стратегий игроков. Кроме того, в случае n х n - игр, когда нам неизвестно, какого игрока считать первым, допустимо транспонирование платёжной матрицы A (замена первого игрока вторым и наоборот) и, во-вторых, в A возможна перестановка равновозможных выигрышей.

Отдельно выделим во множестве Sub(G) множество стандартных преобразований Г, состоящее из решений получаемых из исходного таким образом ( Г ^ Sub(G)). Описанные ранее стандартные преобразования образуют подгруппу в SN и подмножество в Sub(G).

Предложение 1. Множество Sub(G) есть объединение некоторого числа правых смежных классов группы SN по подгруппе стандартных преобразований Г.

Доказательство:

а в а в

Если A^A', а A'^A", где в - стандартные преобразования, то ва : A^A'^A" да-

а

ёт решение A", т.е. получаем из A ^A' целый класс решений, соответствующий правому смежному классу по подгруппе преобразований Г.

Обратимся к случаю 3 х 3 — игры, когда все выигрыши различны. Основным результатом, после обширных вычислений, проведённых автором, есть следующая теорема.

Теорема 2: Каждое решение обратной задачи получается из фиксированного стандартными преобразованиями, т.е. Sub(G)=r.

Доказательство вычислительное. В основе вычислений лежит основное уравнение обратной задачи.

+ У = XoiiUj)+ )> (2)

где ^ = In p,, yy = In q}, Xa(i,j) = In P" ) = In Q'j.

А priori для A" возможны 9! случаев. Однако, пользуясь стандартными преобразованиями, их можно свести к меньшему количеству вариантов. Это варианты, входящие ниже в п.1, 2 и 3.

Так как величины выигрышей особого значения не имеют, а потому обозначим их символами: 1,2,3 и т.д.

1. Элементы какой-либо строки (столбца) матрицы A остаются на одной линии в матрице A'.

Без ограничения общности можно считать, что элементы первой строки: 1,2 и 3 остаются на месте. Если элементы второй строки: 4,5 и 6 обозначить о, а элементы третьей строки: 7, 8 и 9 - * , то матрица A' распадается на следующие подтипы:

Г1 2 3^ г i 2 3^ Г i 2

1) о о о , 2) о о * и 3) о о *

* V * * у о V * * * V * о,

с точностью до перестановки строк в А' и переобозначения о *.

2. Два элемента какой-либо строки (столбца) матрицы А остаются на одной линии в матрице А .

Без ограничения общности можно считать, что элементы 1 и 2 неподвижны, а элемент 3 перешёл во вторую строку:

Г1 2 Л г i 2 '1

1) ' 3 и 2) 3 '

V' ' 'у V' ' 'У

Как и в предыдущем случае, введём обозначения: элементы 4,5 и 6 обозначим о, а элементы 7,8 и 9 - * , таким образом, матрица А' распадается на следующие подтипы:

Г1 2 о Л Г1 2 о Л Г1 2 оЛ Г1 2 оЛ Г1 2 оЛ

1.1) о * 3 , 1.2) о * 3 , 1.3) о * 3 , 1.4) * * 3 ; 1.5) * * 3

о V * * У * V о * *У * V * о У о V * о У о V о *

2.1)

Г1 2 оЛ о з *

* о *

V

2.2)

Г1 2 о Л *з*

*оо

V

3. Никакие два элемента какой-либо строки (столбца) матрицы А не остаются на од-

Г1 о *Л

ной линии в матрице А :

*2о

Vо * 3У

, где о - элементы 4,5 и 6, а * - 7,8 и 9.

Отдельно рассмотрим первый подтип, в случае, когда элементы какой-либо строки

Г12 3 Л

(столбца) матрицы А остаются на одной линии в матрице А':

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ооо

***

V У

Он содержит 36 вариантов. Основное уравнение запишется в виде:

X + У1 = X + У < + ^2 = X + У2 , <

X! + Уз = Х1 + 7з

где а и в некоторые подстановки элементов 1,2 и 3. Складывая уравнения по столбцам, получим

Х2 + У1 = X2 + Уа(1)

Х2 + У 2 = Х2 + У а (2) Х2 + У3 = Х2 + Уа(з)

Х3 + у1 = Х3 + Ув(1) Х3 + у2 = Х3 + Ув(2) > Х3 + у3 = Х3 + Ув(3),

3х1 + у = 3Х1 + У, 3х2 + у = 3Х2 + У, 3x3 + У = 3^3 + У, где у = £ у}., У = £ У. .

]=1 1=1

Выразим X = X +

у - у

, V г = 1,3 . Учитывая замечание о решениях системы (2), мы

у - У

можем считать, что-= 0.

3

Отсюда X = X или у = у = Уа(г) = у(г). Следовательно, А и А' эквивалентны. Все остальные варианты разбираются единообразно. Продемонстрируем это на слу-

Г1 2 оЛ

* * 3

чае, когда матрица имеет вид

Основное уравнение даёт нам систему:

о*о V У

Х1 + У1 = X1 + У Х2 + Уа(1) = X1 + У3 Х3 + Ув(1) = X 2 + У

Х1 + У 2 = X1 + У2 , - Х2 + Уа(2) = X 3 +у, - Х3 + ув(2) = X 2 + У2

Х1 + У3 = X 2 +У3 Х2 + Уа(3) = X 3 + У3 Х3 + ур(3) = X 3 + У2

Имеется 3!=6 вариантов расположения 4,5 и 6 на месте о в А', следовательно, возможны следующие подстановки:

а(1) а(2) а(3)

1) 1 2 3

2) 3 1 2

3) 2 3 1

<

3

3

3

4) 2 1

5) 3 2

6) 1 3 Ограничимся двумя из них:

Вычитая уравнения по столбцам, получим

Г у - у2 = У - У2

3 1 2

Уа(1) - уа(з) - Х1 - Х3

а(з)

IУ1 - Уз - Х1 - Х2 + У1 - Уз' [Уа(2)- У а(3) — У1 - У3 Учитывая замечание теоремы 1, полагаем Х3 — 73 — у3 — 0. Отсюда найдём для первой подстановки Х1 — У1, У — У2, 12 — 2У2 - У1, Х2 — У2.

Матрица В' в аддитивной записи примет вид: В' —

(Ух + У 2 2 У 2 У1 Л

2 У 2

V У 2

3У2 - У1 У2 2 У 2 - У1 0

Учитывая условие нормировки ^р — ^ # . — ^р — ^ ^, — 1, введём нормирующий

множитель (|), знаменатель которого есть сумма всех элементов матрицы. Итак, матрица вероятностей в мультипликативной записи равна

Г еУ1 + У2 е2 У2 еУ1 ^

е2 У2 е3 У2- У1 еу2

еУ2 е2 у 2- У1 1

В' — 1 ц

Так как вероятность элементов а12 и а21, а23 и а31 в А' совпадает, следовательно, А'

получается из А посредством стандартных преобразований. Отсюда А и А' эквивалентны.

При рассмотрении случая 3), согласно теореме 1, мы можем положить

Х3 — У3 — Уз — 0 , тогда Х1 — У2 - У1, У1 — -У1, У2 — У2 - 2У1 , Х2 — У2 - ^У1 . Отсюда, матрица В' в аддитивной записи примет вид:

'У2 - 2У1 2У2 - ^У1 У2 - У1 Л В'— У2 - 4У1 2У2 - 5У1 У2 - 3У1 ■У1 У 2 - 2 У1 0

Найдём матрицу вероятностей для одного из шести вариантов расположения 7,8 и 9

Г1 2 5 ^

на месте *, например: А' =

7 8 3 6 9 4

. Вычитая уравнения по столбцам в третьей системе

У

основного уравнения, получим

ГУр(1) - Ур(з) — Х2 - Х3 + У1 - У2 ГУ1 - Уз — X2 - Хз + У1 - У2

< или < .

[УР(2) - Ув(з) — х2 - Х3 [У2 - У3 — х2 - Х3

Полагая Х3 — Г3 — у3 — 0, из основного уравнения найдём у1 — 0. Отсюда

X1 — У2, У — 0, У2 — У2 , X2 — У2 .

вероятностей в мультипликативной записи

В' — 1

ц

Итак, матрица

Г еу2 е2 у2 еу2 ^

еу2 е2 у2 еу2 ,

1 еУ2 1

равна

, где знаменатель нормирующего множителя (ц) есть сумма всех

у

элементов матрицы. Исходная матрица вероятностей тогда примет вид:

V

в = I

СеУг 1

,2 У2

,У2

,2 У2

У2

1

У2

Так как вероятность элементов аз, а2з и азг, аз1 и аз в А' совпадает, следовательно, А' получается из А перестановкой равновозможных выигрышей. Поэтому А и А' эквивалентны.

III. Проблема нахождения решений заключается в расстановке элементов множества Ы Ьг>. е в] по строкам и столбцам матрицы так, чтобы ранг последней оказался равным 1

(поскольку строки в матрице вероятностей (В) пропорциональны). Простой перебор требует для т х п - игры рассмотрения (тп) случаев, что совершенно неприемлемо даже при сравнительно небольших значениях т и п. Однако число случаев, подлежащих перебору, можно значительно уменьшить. Для этого надо образовать всевозможные частные элементов Ьг}.

(достаточно, впрочем, взять отношения, большие или равные 1). Среди них должны быть достаточно длинные серии одинаковых, которые встречаются не менее трёх раз, например, отношения соответственных элементов каких-либо строк (столбцов) в предполагаемом решении. В качестве иллюстрации приведём следующий пример для 3 х 3 - игры.

Пусть известны вероятности появления выигрышей, а также сами выигрыши.

Таблица

Выигрыши и частоты появления выигрыша

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Выигрыши -2 -1 0 1 2 3 4 5 6

Частота 0,312 5

появления выигрыша 0,0625 0,0833 0,04167 0,02083 0,10417 0,04167 0,2083 0,125

Составим всевозможные частные, среди них достаточно взять отношения, большие или равные 1, которые встречаются не менее трёх раз. 0,3125 _ 0,10417 _ 0,2083 1 0,0625 = 0,02083 = 0,04167 = '

0,3125 0,0625 0,125

2) —--= —-= —-= 3;

0,10417 0,02083 0,04167

0,3125 _ 0,0625 _ 0,125 3 1 1,5 ;

0,2083 0,04167 0,0833

0,3125 0,10417 0,2083 _

4) —-= —-= --= 2,5;

0,125 0,04167 0,0833

0,0833 _ 0,04167 _ 0,2083 _ 0,125 _2

1 0,04167 = 0,02083 = 0,10417 = 0,0625 = '

„ 0,3125 0,10417 0,2083 ^ ^

Выберем одно из них, допустим отношение 11 -=-=-= 5. Есте-

0,0625 0,02083 0,04167

ственно предположить, что числители данных отношений есть вероятности появления выигрышей, стоящие в первой строке матрицы вероятностей В, тогда знаменатели можно считать за элементы второй строки:

(0,3125 0,10417 0,2083 ^

В =

0,0625 0,02083 0,04167

Для восстановления третьей строки надо выявить отношения, в которых либо числитель, либо знаменатель совпадает с элементами первой или второй строки. Это отношение 5). Отсюда элементами третьей строки будут числители этих отношений и матрица вероятностей В примет вид:

'0,3125 0,10417 0,2083 ^ В = 0,0625 0,02083 0,04167 ч 0,125 0,04167 0,0833 ^ По матрице В восстановим вероятности выбора стратегий соответственно первым и

р /5 1 1 ^ ' ^

вторым игроком Р =

Q = < J1 1 1 i

и U' 6' 3 1 и соответствующие ей платежные матрицы

Г- 2 3 5 > '- 2 3 5>

= -1 2 1 и A' = -12 4

V 6 4 0 V v 610 V

Из данного примера видно, что матрицы A и A' эквивалентны, так как А получается из А перестановкой равновозможных выигрышей

В заключение отметим, что автором были также проведены вычисления (хотя и неполные для антагонистической n х n - игры с n > 3 ). Оказалось, что и там решения получаются из фиксированного стандартными преобразованиями. Поэтому можно выдвинуть следующую гипотезу, что аналогичный результат верен в общем случае n х n при n > 3 игры (выигрыши по-прежнему предполагаются различными).

Библиографический список

1. Верещагина, Е.И. О единственности решения обратной задачи антагонистической игры с различными элементами платёжной матрицы // Труды Нижегородского государственного технического университета им. Р.Е. Алексеева / НГТУ. - Н. Новгород, 2010. №1 (86). С. 346352.

2. Петросян, Л.А. Теория игр / Л.А. Петросян, Н.А. Зенкевич, Е.А. Семина. - М.: Высш. шк., 1998. - 304 с.

Дата поступления в редакцию 25. 01.2012

E.I. Vereshagina

THE INVERSE PROBLEM TWO PLAYERS ANTAGONISTIC 3x3 - GAME WITH DIFFERENT ELEMENTS OF PAYOFF MATRIX

Nizhny Novgorod State Technical University n.a. R.Y. Alexeev

In this paper the inverse problem two players antagonistic - game is considered. The inverse problem consists in the reconstruction of the payoff matrix and the probabilities of the mixed-strategies of players if it is known the win probabilities. It is suggested that the payoff matrix has different elements. It is not necessary for the game to be optimal. The case two player antagonistic - game is analyzed. The method of the all solutions finding is given. It is shown that all solutions of the inverse problem can be received from one of them by means of substitutions of rows and columns. Also it is possible to receive solutions of the inverse problem by substitution of payoffs that have equal probabilities. In conclusion the conjecture is declared that the all solutions for n=m (n>3) can be find as in the case n=3. In the case n m conjecture is not corrected.

Key words: antagonistic game, inverse problem, payoff matrix, win probability.

i Надоели баннеры? Вы всегда можете отключить рекламу.