Научная статья на тему 'О единственности решения обратной задачи антагонистической игры с различными элементами платёжной матрицы'

О единственности решения обратной задачи антагонистической игры с различными элементами платёжной матрицы Текст научной статьи по специальности «Математика»

CC BY
42
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНТАГОНИСТИЧЕСКАЯ ИГРА / ОБРАТНАЯ ЗАДАЧА / ПЛАТЁЖНАЯ МАТРИЦА / ВЕРОЯТНОСТИ ВЫИГРЫ­ШЕЙ / КЛАССЫ ЭКВИВАЛЕНТНОСТИ / ANTAGONISTIC GAME / INVERSE PROBLEM / PAYOFF MATRIX / WIN PROBABILITY / EQUIVALENCE CLASSES

Аннотация научной статьи по математике, автор научной работы — Верещагина Е. И.

Рассматривается обратная задача для m χ n антагонистической игры двух игроков. Предполагается, что платёжная матрица имеет различные элементы. Также предполагается, что вероятности выигрышей извест­ны. Вводится понятие эквивалентности решений и даётся метод вычисления числа классов эквивалентности. Разобран случай 2 χ 3 игры.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On the unicity of the solution of the inverse problem for antagonistic game with different elements of payoff matrix

In this paper the inverse problem two player antagonistic m χ η game is considered. It is suggested that the payoff matrix has different elements. It is suggested too that the win probabilities are known. The definition of the solu­tions equivalence is given. The calculation method of the quantity equivalence classes also given. The case two player antagonistic 2 χ 3 game is analyzed.

Текст научной работы на тему «О единственности решения обратной задачи антагонистической игры с различными элементами платёжной матрицы»

УДК: 519.81/.83

Е.И. Верещагина

О ЕДИНСТВЕННОСТИ РЕШЕНИЯ ОБРАТНОЙ ЗАДАЧИ АНТАГОНИСТИЧЕСКОЙ

ИГРЫ С РАЗЛИЧНЫМИ ЭЛЕМЕНТАМИ ПЛАТЁЖНОЙ МАТРИЦЫ

Нижегородский государственный технический университет им. Р.Е.Алексеева

Рассматривается обратная задача для т х п - антагонистической игры двух игроков. Предполагается, что платёжная матрица имеет различные элементы. Также предполагается, что вероятности выигрышей известны. Вводится понятие эквивалентности решений и даётся метод вычисления числа классов эквивалентности. Разобран случай 2 х 3 игры.

Ключевые слова: антагонистическая игра, обратная задача, платёжная матрица, вероятности выигрышей, классы эквивалентности.

Классическая постановка построения матричной игры с заданным решением и описание множества всех m х n - игр с заданными множествами оптимальных стратегий игроков была дана Х. Боненбластом, С. Карлином и Л. Шепли [1]. Соответствующие рассуждения в более наглядной форме, принадлежащей Д. Гейлу и С. Шерману, проведены у Н.Н. Воробьёва [2]. В данной работе автором рассматривается обратная задача для антагонистической игры при неоптимальном поведении игроков. Сформулируем её: из достаточно длинной серии игр сторонний наблюдатель имеет возможность узнать частоту (вероятность) появления определённого выигрыша. Требуется по этой информации восстановить платёжную матрицу.

Предполагается, что игроки применяют смешанные стратегии, и все чистые стратегии используются с положительными вероятностями. Будем предполагать, что все выигрыши различны. В этом случае статистика позволяет найти вероятность каждого из них. Значение выигрышей, поскольку вопросы оптимальности игры здесь не рассматриваются, в дальнейшем просто нумеруются: 1,2,3 и т.д. В частности, не вызывает недоразумения обозначения

A =

(l 2 3 Л

v4 5 6,

Pi P2

A' =

(3 i 2 Л

v6 4 5J

Pi P2

01 02 03 03 01 02

для платёжных матриц 2 х 3 - игр, где р, ч ■ (г = 1,2; у = 1,2,3) вероятности выбора стратегий

игроками, если последние нужно явно указать.

В этой работе не излагается известный автору алгоритм нахождения решений обратной задачи, поскольку больший интерес представляет вопрос, с какой точностью решения определяются.

Итак, мы исходим из какого-либо решения т х п игры

(

A =

an

av

an

a,

an

u 1 u л

V ml m 2

mn J * m

Pi P2

q 42 •■■ qn

© Верещагина Е.И., 2011.

с известной матрицей вероятностей В = (Ц )• Конечно, по матрице В вероятности выбора стратегий р и qj легко определяются: р = XЦ , ^ = X Ь ( = 1,т; 7 = 1,п)•

7 '

Любое другое решение задачи о восстановлении платёжной матрицы А' = (а' ) отли-

чается от исходного перестановкой элементов матрицы А: а', ., = а^ где (, 7', 7') - биек-ция. В матрице вероятностей В' = Ц' )= ^-), конечно же, Ц, .- = Ц = Р,^ :

Р -б/ = Р^ • (1)

Данное уравнение будем называть первым основным уравнением.

Особо отметим некоторые решения, получаемые из исходного. Во-первых, это решения, где А ' получается из А перестановкой строк и столбцов, это равносильно изменению нумераций стратегий игроков. Кроме того, в случае п х п игр, когда нам неизвестно, какого игрока считать первым, допустимо транспонирование платёжной матрицы А (замена первого игрока вторым и наоборот). Во-вторых, в А возможна перестановка равновозможных выигрышей.

Решения, получаемые из исходного таким образом, будем считать эквивалентными. Довольно обширные вычисления, проведённые автором, позволяют выдвинуть предположение, что число классов эквивалентности невелико и, «вообще говоря», равно единице.

В основе вычислений - первое основное уравнение (1), которое переходом к логарифмам вероятностей ( х = 1п р , у = 1п qj, Х;, = 1п Рг и ^' = 1п ') переписывается в виде

х + у у = X ' + Уу'. (2)

Это соотношение можно рассматривать как однородную систему уравнений относительно х, у, X и У, если временно не обращать внимания на условия нормировки X Р = = X Р{ = Хб =1. Их выполнения можно добиться после решения (2), вводя подходящий нормирующий множитель в экспоненты.

Уравнение (2) инвариантно относительно сдвигов х, у, X, У на фиксированную величину, это позволяет считать

пХ х+тХ у 7 = пХ X + тХУ/ =0 • (3)

' 7 ' 7

Что в дальнейшем и будет предполагаться выполнимым.

Исключение из (2) величин х, у даёт предложение (второе основное уравнение)

, ( Л ( Л (4)

тп(Х, + Уг)= т XX, + XУ7■ + п( XX, + XУ,' •

V 7 7 У V ' ' У

Для доказательства следует просуммировать (2) по / и ] , что даёт

пхг +X у 7 =X(X, + У7 ) и X х + ту 7 =X(X1' + Уг )•

7 7 ' '

Затем выразить отсюда xi, у . и подставить их в (2), используя (3).

Применение (2) и (4) проиллюстрируем на примере 2 х 3 игры. При переходе от матрицы А к А обязательно найдутся два элемента в строчке из А , остающиеся в строчке и в А'. Перестановкой строк и столбцов можно добиться того, чтобы эта пара элементов осталась неподвижной. Без ограничения общности можно считать, что это элементы 1 и 2.

Итак,

А =

'12 3 1

V4 5 ^

Р1 Р2

А' =

Г1 2 Л

у

Р, Р

Чх 42 Чъ 01 02 Оз

Имеется 4!=24 варианта расположения элементов 3,4,5 и 6 на месте точек в А'. Ограничимся несколькими из них.

'12 3 1 '1 2 41

1. А = , А' =

V4 5 бУ V 3 б 5У

Первое основное уравнение даёт систему:

X + У = X + Ух

XI + У 2 = Х1 + У2

Х1 + Уз = Х 2 + У1

Х2 + У1 = Х1 + У3 ' Х2 + У 2 = Х 2 + У3 Х2 + У3 = Х 2 + У2

Из неё получаем х - х2 = У - У = X - Х2 + У - У = У - У, откуда следует У2 = Уъ и Х + Уъ = Х + У .

Вероятности выигрышей 3 и 4, 5 и 6 оказываются равными, следовательно А, А' эквивалентны.

'12 3 1 '1 2 51

2. А = , А' =

V4 5 бУ V 3 б 4у

Первое основное уравнение:

Х + Ух = X1 + Ух;

X + У 2 = X1 + У2;

XI + У3 = X2 + У1;

х2 + У1 = X2 + У; х2 + У 2 = X1 + У;

Х2 + У3 = X2 + У2'

Учитывая выкладки из доказательства второго основного уравнения |3х +(У1 + У 2 + У3 ) = 2X1 + Х + 2У1 + У2;

[3х2 +(У1 + У2 + У3 ) = Xl + 2 Х + У2 + 273;' (х1 + х2 + х3)+2 У1 = X1 + Х2 + У1 + У3;

(х1 + х2 + х3)+2 У2 = 2 X1 + У2 + У3; (хх + х2 + х3)+2 У3 = 2 X + У + У,

оно запишется в виде

б(х + у )= б(X + У ) = 7 Х + 5 Х + 7У + 2У2 + 3У; б(х1 + у2 ) = б(X1 + У2 ) = 10 X + 2 Х2 + 4У + 5У2 + 3У3; б(х + у3 )= б^2 + У ) = 4 Х + 8 Х2 + 7У + 5У;

<

II

Ф2 + у )= б( X, + У3 ) = 5 Х + 7 Х2 + ЗУ + 2 У + 7 У; Ф2 + У2 ) = б(X + У ) = 8 Х + 4 Х2 + 5У2 + 7У3; Ф2 + Уз ) = б( X, + У2 ) = 2 Х +10 Х2 + ЗУ + 5У2 + 4У3.

Добавив к нему условие (3) и отбросив уравнения, являющиеся линейной комбинацией других, получим ответ, который определяется с точностью до постоянного множителя:

х1 + у1 =1; х1 + у 2 = -1;

х1 + УЗ = -3; х2 + у1 =3; • х2 + у 2 = 1; х2 + уз =-1.

, 1 (х1 х-1 х-3 Л

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Итак, матрица вероятностей равна В = —

ц V х3 х1 х-1 у

, где знаменатель норми-

рующего множителя (ц) есть сумма всех элементов матрицы.

1 (х1 х-1 х3 Л

Исходная матрица вероятностей тогда примет вид В = — •

ц V х х х у

Матрицы А и А ' эквивалентны, так как В' получается из В перестановкой строк и столбцов, что равносильно изменению нумераций стратегий игроков.

(12 3 Л (1 2 в Л

3^ А = , А' =

V4 5 6У V 3 4 5У

Первое основное уравнение:

х + у = X + У ;1 х1 + у 2 = Xl + У2;

х1 + уз = х 2 + У1; < •

х2 + у1 = + У2; ' х2 + у2 = X2 + У3; х2 + уз = X + У3.

Проведём выкладки из доказательства второго основного уравнения: 13х1 +(у1 + у2 + уз) = 2X1 + Х2 + 2У + У; ,

[Зх2 + (у1 + у 2 + уз ) = X + 2 Х2 + У + 2У3;' (х1 + х2 + х3)+ 2 у1 = X + Х2 + У + У2;

(х1 + х2 + хз)+ 2 у 2 = X1 + Х2 + У2 + Уз; (х1 + х2 + х3)+ 2 у3 = Х + X2 + У + У.

Вследствие чего оно запишется в виде

б(х! + у ) = в(х + У ) = 7 Х + 5 Х2 + 7У + 5 У;

б(х + у2 ) = в(X + У ) = 7 Х + 5 Х2 + 4У + 5У2 + ЗУ; в(х + у3 ) = 6^2 + У ) = 7 Х + 5 Х2 + 7У + 2У2 + ЗУ;

<

<

II.

б(х2 + у ) = б(Х + У ) = 5 Х + 7 X + 3У + 5У2 + 4У3;

б(х2 + у 2 )= б(X 2 + У3 ) = 5 Х1 + 7 Х 2 + 5У2 +

б(х2 + у3 )= б^! + У ) = 5 Х + 7 Х2 + 3У + 2У2 + 7У3.

Добавив к нему условие (3) и отбросив уравнения, являющиеся линейной комбинацией других, получим ответ, который определяется с точностью до постоянного множителя:

х + У1 =5; х1 + у 2 =1;

Х1 + У3 =-3;

<

х2+У1 =3;

х2+У 2 = -1;

Х2 + У3 =-5.

Итак, матрица вероятностей равна В' = —

^5 X3

X1 X -

X

3

X-

, где знаменатель норми-

рующего множителя ц есть сумма всех элементов матрицы.

Исходная матрица вероятностей тогда примет вид В =

Л 5

X5 X1 X3

X-1 X-5 X-3

Л

Из данного примера видно, что матрицы А и А не эквивалентны, так как перестановкой строк и столбцов в В, элементы X и X 1, стоящие в одном из столбцов матрицы В', невозможно свести к их соответствующему расположению в В .

При рассмотрении последующих 21 варианта расположения элементов 3,4,5 и 6 на месте точек в А , было обнаружено ещё два случая неэквивалентности платёжных матриц. Отдельно приведём их:

'1 2 3 1 '1 2 б1

4. А = , А' =

V4 5 бУ V 5 3 4 у

Первое основное уравнение

х + У1 = X1 + У ;1 Х1 + У 2 = X1 + У2;

Х1 + У3 = X2 + У2; Х2 + У1 = X 2 + У3;

Х2 + У 2 = ^ + У1;

Х2 + У3 = X1 + У3.

Учитывая

3Х1 +(У1 + У 2 + У3 ) = 2X1 + Х2 + У1 + 2У2; 3x2 +(У1 + У 2 + У3 ) = Xl + 2Х2 + У1 + 2У,;'

^ + х2 + х3 )+ 2 У! = X + X + У + У; (х!+х2 + х3)+2у2 = X + X + У + У;. (х! + х2 + х3)+ 2у3 = Х + X + У + У,

б(х + у ) = б^! + У ) = 7 Х + 5 Х2 + 5У + 4У2 + 3УЪ; б(х + у 2 )= б( X + У ) = 7 Х + 5 Х + 5 У + 7У2; б(х + у3 ) = б(X + У ) = 7 Х + 5 Х2 + 2У + 7У2 + 3У.

<

5

II

б(х2 + у) = 6^2 + У) = 5 Х + 7 Х + 5У + 7 У; б(х2 + у2 ) = б(X + У ) = 5 Х + 7 Х + 5У + ЗУ + 4У3; б(х2 + у3 )= б(X + У ) = 5 Х + 7 Х + 2У + ЗУ + 7У3.

Запишем ответ, который определяется с точностью до постоянного множителя:

'х1 + у1 =1; х1 + у 2 = 5; х1 + УЗ = -3; х2 + у1 = -1; • х2 + у 2 = 3; х2 + уз =-5/

Итак, матрица вероятностей и соответствующая ей исходная матрица вероятностей

1 (х1 х5 х-3 Л 1 (х1 х5 х3 Л

примут вид В' = —

ц

х -1 х 3 х -

и В = -

ц

V х 5 х 1 х 3 у

где знаменатель нормирующего

множителя ц есть сумма всех элементов матрицы.

Учитывая замечание к предыдущему примеру можно сделать вывод, что матрицы А и А' не эквивалентны.

(12 3 Л (1 2 4Л

5^ А = , А' =

V4 5 бУ V 5 б 3У

Первое основное уравнение

х + у1 = X1 + У{; х1 + у 2 = X + У2;

х1 + уз = х2 + уЗ;

х2 + у1 = X + У3;

х2 + у 2 = X2 + У1;

х2 + УЗ = X2 + У2.

Второе основное уравнение:

II

'б(х + у ) = б(х + У ) = 10 Х + 2 Х + 5У + 2У + 5У; б(х + у2 ) = б(х + У )= 7 Х + 5 Х + 5У + 5У + 2У; б(х + у3 )= б(Х + У ) = 4 Х + 8Х2 + 2У + 5У2 + 5У3; б(х2 + у) = б(X + У) = 8 Х + 4 Х + 5У + 2У2 + 5 У; б(х2 + у2) = б( X + У) = 5 Х + 7 Х + 5 У + 5 У + 2У; б(х2 + у3) = б(X + У) = 2Х +10Х + 2У + 5У + 5У3 / Запишем ответ с точностью до постоянного множителя

х1 + у1 = 5; х + у 2 = 1;

х + уз =-з;

х2+у1 =3; •

х2+у 2 = -1;

х2 + уз =-5.

<

<

I

Отсюда, матрица вероятностей равна B' =1

Ц

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

^5 X3

X1 X 1

X 3 ^ X5

следовательно, соответ-

у

ствующая ей исходная матрица вероятностей примет вид B =

^X5 X ^

X1 X3

X-5 X-3

Л

Из данного примера также видно, что матрицы А и А' не эквивалентны.

Рассмотрение всех 24-х вариантов расположения элементов 3, 4, 5 и 6 на месте точек в А ' в антагонистической игре 2 х 3 при неоптимальном поведении игроков показало, что наряду с такими преобразованиями матрицы игры как: перестановка строк, столбцов и рав-новозможных выигрышей были обнаружены три случая неэквивалентности платёжных мат-

'1 2 б ^'12 б^ '1 2 4 ^

риц. Отдельно приведём их: A' =

3 4 5

5 3 4

у

5 6 3

и соответствующие им

- w 1

матрицы вероятностей B = —

Ц

Л 5

-3 Л

X5 X1 X

X3 X-1 X-5

(\ 1

-3 Л

XXX

X-1 X3 X-5

(\ 5

X5 X1 X

3

X3 X-1 X-5

В заключении отметим, что автором были также проведены более ста вариантов расчётов для антагонистической 3 х 3 игры двух игроков, среди которых не обнаружилось случаев неэквивалентности платёжных матриц и которые позволили сделать вывод о единственном классе эквивалентности.

Библиографический список

1. Матричные игры: сб. переводов; под ред. Н.Н. Воробьева. - М.: Государственное издательство физико-математической литературы, 1961. - 280 с.

2. Воробьев, Н.Н. Основы теории игр. Бескоалиционные игры / Н.Н. Воробьев. - М.: Наука. Главная редакция физико-математической литературы, 1984. - 496 с.

3. Петросян, Л.А. Теория игр / Л.А. Петросян, Н.А. Зенкевич, Е.А. Семина. - М.: Высш. шк., 1998. - 304 с.

Дата поступления в редакцию 25.01.2011

E.I. Vereshagina

ON THE UNICITY OF THE SOLUTION OF THE INVERSE PROBLEM FOR ANTAGONISTIC GAME WITH DIFFERENT ELEMENTS OF PAYOFF MATRIX

In this paper the inverse problem two player antagonistic m x n - game is considered. It is suggested that the payoff matrix has different elements. It is suggested too that the win probabilities are known. The definition of the solutions equivalence is given. The calculation method of the quantity equivalence classes also given. The case two player antagonistic 2 x 3 - game is analyzed.

Key words: antagonistic game, inverse problem, payoff matrix, win probability, equivalence classes.

i Надоели баннеры? Вы всегда можете отключить рекламу.