Научная статья на тему 'Об одной обратной задаче теории игр'

Об одной обратной задаче теории игр Текст научной статьи по специальности «Математика»

CC BY
315
62
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБРАТНАЯ ЗАДАЧА / ПЛАТЁЖНАЯ МАТРИЦА / ВЕРОЯТНОСТИ ВЫИГРЫШЕЙ

Аннотация научной статьи по математике, автор научной работы — Верещагина Евгения Игоревна

Рассматривается обратная задача для -игры двух игроков. Предполагается, что платёжная матрица имеет различные элементы. Также предполагается, что вероятности выигрышей известны. Вводится понятие эквивалентности решений. Это решения, которые могут быть получены друг из друга перестановкой строк (столбцов) и перестановкой выигрышей, имеющих одинаковую вероятность. Указывается метод подсчёта числа классов решений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON AN INVERSE PROBLEM OF GAME THEORY

The inverse problem of a two player game is considered. It is assumed that the payoff matrix consists of different elements and the win probabilities are known. The notion of equivalent solutions is introduced. These solutions can be obtained from each other by the permutation of rows (columns) and payoffs with equal probabilities. A procedure to calculate the number of equivalence classes is given.

Текст научной работы на тему «Об одной обратной задаче теории игр»

Матем атика

Вестник Нижегородского университета им. Н.И. Лобачевского, 2013, № 4 (1), с. 194-198

УДК 519.81/83.

ОБ ОДНОЙ ОБРАТНОЙ ЗАДАЧЕ ТЕОРИИ ИГР © 2013 г. Е.И. Верещагина

Нижегородский государственный технический университет им. Р.Е. Алексеева

vereshagina.evgenija@rambler.ru

Поступила в редакцию 08.06.2012

Рассматривается обратная задача для т х п -игры двух игроков. Предполагается, что платёжная матрица имеет различные элементы. Также предполагается, что вероятности выигрышей известны. Вводится понятие эквивалентности решений. Это решения, которые могут быть получены друг из друга перестановкой строк (столбцов) и перестановкой выигрышей, имеющих одинаковую вероятность. Указывается метод подсчёта числа классов решений.

Ключевые слова: обратная задача, платёжная матрица, вероятности выигрышей.

В статье рассматриваются конечные игры двух лиц. Игра этого типа - это матричная т х п -игра, в которой первый игрок располагает т стратегиями, а второй - п стратегиями. Чтобы не вводить новые термины, мы используем известные термины «выигрыш» и «платежная матрица», придавая им более широкое толкование. Именно, под выигрышем понимается элемент множества W, характеризующий исход игры при выборе игроками фиксированных стратегий. Таким образом, W не обязано быть подмножеством множества R1, как это предполагается в теории антагонистических игр, или R2 для биматричных игр. В дальнейшем элементы W будем нумеровать натуральными числами, рассматривая последние лишь как символы для обозначения выигрышей.

Предполагается, что игроки применяют смешанные стратегии. Исходная информация об игре состоит в задании платежной матрицы

А = (а.)

и вероятностей рх, р2,..., Рт

и

q1, ч2,... qn, с которыми игроки выбирают свои чистые стратегии. Способы компактной записи этой информации иллюстрируют следующие два примера 2 х 3 -игр:

(1

4

х

6

6

(1

4

3.

6

5

В первом из них 1, 2, 3, 4, 5, 6 - выигрыши, причем различные. Во втором выигрыши - 1, 2, 3, 4, 5, и выигрыш 3 встречается дважды. Правые столбцы - это вероятности выбора стратегий первым игроком, а нижние строчки - вероятности для второго игрока.

Из-за того, что выигрышами могут служить объекты произвольной природы, для рассматриваемых игр исключаются задачи, связанные с теми или иными условиями оптимальности.

По-видимому, единственным кандидатом на роль прямой задачи служит следующая: по заданной платёжной матрице А = (а.) и вероятностям стратегий р1, р2,..., рт и q1, q2,... qn найти вероятности выигрышей а..

Задача эта совершенно тривиальна, и её решение оформляется в виде матрицы вероятностей В = (Ь .), где Ь. = р д и есть вероятность

выигрыша а..

Поставим обратную задачу: зная множество элементов матрицы вероятностей В , но не саму матрицу В, восстановить платежную матрицу А вместе с вероятностями стратегий игроков

р»Р2,■ ■ •,Рт и q2,.,qn.

Достаточно, впрочем, ограничиться восстановлением матрицы В, т.к.

р <=Еь., ч.=Еь .

Формулировка обратной задачи выглядит достаточно нестандартно. Поэтому уместно привести мотивировку её постановки. Пусть проводится достаточно длинная серия реализаций игры. Пусть сторонний наблюдатель фиксирует исходы (выигрыши) реализаций. Частоты появлений выигрышей, как известно из математической статистики, дают хорошие приближения к их вероятностям. Тем самым, наблюдатель находится в ситуации, описываемой обратной задачей, по крайней мере, в случае, когда все выигрыши различны.

и

Таблица 1

Выигрыши 1 2 3 4 5

Вероятности 6 4 2 2 4 3 1

появления выиг- 1 =

рыша 18 18 18 18 18 18 18

Последующее изложение разбито на несколько пунктов.

В пункте 1 более точно формулируются требования к исходным данным обратной задачи. Эти требования естественно появляются в связи с приведенной выше мотивировкой задачи. Кратко обсуждается иная обратная задача, рассмотренная Х. Боненбластом, С. Карлином и Л. Шепли в [1]. Сравнение обеих задач приводит к заключению, что акцент в нашей задаче следует перенести на исследование строения множества решений, а не на проблему их существования.

В пункте 2 проводится разбиение множества решений обратной задачи на классы. В класс объединяются решения, в определенном смысле незначительно отличающиеся друг от друга. Решения из разных классов (если число классов более одного) существенно различны: наборы восстанавливаемых вероятностей стратегий для них могут не совпадать.

В пункте 3 обратная задача сводится к задаче линейной алгебры, устанавливаются так называемые основные уравнения и приводится алгоритм вычисления числа классов в обратной задаче формата 2 х п .

В пункте 4 изложенный метод иллюстрируется на примере 2 х 3 -игры.

1. Чтобы уменьшить неопределенность при решении обратной задачи, потребуем выполнения следующих условий:

Р1. Вероятности стратегий положительны.

Р2. Выигрыши можно отличить друг от друга.

Р3. Известен формат игры.

Первое условие естественно, так как неиспользуемые стратегии в игре не участвуют, и их исключение из рассмотрения просто меняет формат игры.

Второе принимается с целью упрощения формализации обратной задачи, хотя на практике могут встречаться ситуации, где оно не выполняется, т.е. набор вероятностей не полон, как, например, это видно из представленного выше примера 2 (см. таблицу 1).

Это обстоятельство усложняет исследование.

Условие Р3 - это независимое условие, поскольку формат игры по Р1 и Р2 однозначно не восстанавливается (восстанавливается лишь произведение тп). Так, например, если матрица вероятностей содержит 12 элементов, то ей может соответствовать как 3 х 4 -, так и 2 х 6 -игра.

Следует заметить, что идея обратной задачи в теории игр высказывалась и ранее. Сошлемся

на вышеуказанную статью Х. Боненбласта, С. Карлина и Л. Шепли «Решение дискретных игр двух лиц» в сборнике [1]. Полезно будет сравнить обратную задачу в предлагаемой статье с задачей, которая была решена в [1]. В последней рассматривается антагонистическая игра заданного формата с известными множествами оптимальных стратегий обоих игроков. Требуется восстановить платежную матрицу.

Сравнение обеих задач проведем с точки зрения основных вопросов, которые являются предметом изучения многих математических задач. Это вопросы существования и единственности решений, а также методы нахождения последних.

В работе [1] при рассмотрении вопроса о возможности построения игры с заданным решением приводится изящное условие разрешимости задачи. В нашей задаче положение обстоит несколько хуже. Имеется в виду, что если произвольно задать тп элементов (положительных и в сумме дающих единицу), то всегда ли возможно построение матрицы вероятностей В с таким набором элементов? Ответ, вообще говоря, отрицательный. Так, например, рассмотрим множество элементов вида

рЪ 7Г’•••, РП , где P2,■■■, Ртп - простые

тп

числа, а Р = ^ р1. . В матрице вероятностей В

1=1

отношение соответствующих элементов двух строк (столбцов) постоянно, т.е. существуют достаточно длинные серии одинаковых отношений элементов матрицы В . Для указанного множества все отношения различны, и нужная матрица В не существует. Автору не известно условие разрешимости задачи, т.е. существование матрицы В с заданным множеством элементов.

Вопрос о том, с какой точностью определяется решение, представляется гораздо более интересным. Авторы задачи в [1] вопросы единственности решения не исследуют. Однако анализ их статьи показывает, что решение не единственно. Чтобы понять этот факт, достаточно вспомнить, что при нулевой цене игры матрица А может быть заменена на ХА (Х> 0). В предлагаемой нами задаче решение также не единственно. Например, мы можем изменить нумерацию стратегий игроков и получить формально отличную от первоначальной платеж-

ную матрицу. В связи с этим можно привести

еще один, более интересный, пример 2 х 3 -

игры. Пусть элементы матрицы В образуют

Г 1 2 4 8 16 32] ^

множество <—, —, —,—,—,— >. Легко про-I 63 63 63 63 63 63 I

верить, что платежные матрицы

(1 2 3 Ц .. (1

А =

4 5 6

А' =

3

16

21

21

_1_

21

дают одни и те же указанные выше элементы матрицы вероятностей. Оба решения в некотором смысле существенно различны, т.к. наборы вероятностей стратегий для них не совпадают, и изменение нумерации стратегий не может перевести одно решение в другое.

Перейдем к проблеме нахождения решений в обеих задачах. В задаче [1] авторы приводят алгоритм полного построения. В нашей задаче алгоритмом можно назвать следующую конструкцию. Рассматривается множество, состоящее из всевозможных отношений элементов матрицы В . Среди них, как указывалось ранее, должны быть достаточно длинные серии одинаковых. Такие серии являются кандидатами на отношения соответственных элементов строк или столбцов в предполагаемом решении. Зная отношения, нетрудно восстановить и строки матрицы В .

В заключение скажем, что, в отличие от задачи [1], здесь представляется более интересным вопрос об описании множества решений, и далее именно этим вопросом мы и будем заниматься. В частности, будем интересоваться наличием существенно различных решений, в которых вероятности стратегий могут не совпадать.

2. Начиная с этого пункта предполагается, что решение обратной задачи существует. Пусть решение описывается следующей матрицей:

А =

V ат1

Р1

Р2

Ч Ч2 ••• Чп

Величины р1,р2,...,рт и ч1,д2,... Чп означают вероятности выбора игроками соответствующих стратегий.

Заметим, что различные решения отличаются друг от друга перестановкой элементов платежной матрицы: А = (ау) ^ А = (а’у). Два решения объединяем в один класс, если одно из другого может быть получено следующими преобразованиями:

1) преобразования, связанные с изменением нумераций стратегий игроков, что равносильно перестановке строк (столбцов) в матрице А ;

2) если т = п , то операция транспонирования;

3) перестановка в А равновозможных выигрышей.

Решения из одного и того же класса будем называть эквивалентными. Очевидно, что решения с разными наборами вероятностей стратегий заведомо относятся к разным классам (т.к. при вышеописанных преобразованиях набор вероятностей стратегий не меняется).

Если выделить одно из решений в качестве фиксированного, то другие решения можно характеризовать перестановками элементов платежной матрицы этого фиксированного решения. Следующая теорема характеризует такие перестановки.

Теорема. Перестановки, соответствующие решениям одного класса, составляют правый смежный класс в симметрической группе N = (тп}|) по подгруппе Г, где Г состоит из перестановок, соответствующих преобразованиям 1-3.

Доказательство. Пусть решение А' получается из фиксированного решения А подстановкой РеSN . Эквивалентные решения соответствуют подстановкам, полученным из Р с помощью преобразований 1-3. Эти подстановки имеют вид §Р, где g е Г , т.е. заполняют правый смежный класс в симметрической группе SN N = (тп)|) по подгруппе Г.

3. Здесь мы интересуемся, как было сказано выше, возможностью других решений, если известно одно из них. Любое другое решение задачи о восстановлении платежной матрицы А = (а у), как было отмечено, отличается от указанного перестановкой элементов матрицы

а

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

А : а'., = ау, где (г, у)^(/' ,у') - некоторая подстановка из SN. Если наборы вероятностей стратегий другого решения обозначить через Р ',Р2',...,Рт и Q’l,0’2,---0’п, то имеет место следующее соотношение:

РДу= РА у (1)

Таким образом, отыскание остальных решений сводится к перебору подстановок а и решению системы (1).

Переход к логарифмам вероятностей

Р< ^ 1пР,- = X , Чу ^ 1пЧу = У у, Р ^ 1пр = Х( и Qj, ^ 1nQу' = У у дает систему, которую мы запишем в развернутом виде:

и

5

а

а

11

а

а

а

2п

а

а

т2

т

X1 + yi = X a1 (1,1) + Ya2 (1,1), X1 + y2 = X a1 (1,1) + Ya2 (1,1),

X1 + Ун Xai (l,n) + Ya2 (l,n),

X1 + yi = X a1 (1,1) + Ya2 (1,1), X1 + yl = X a1 (1,1) + Ya2 (1,1),

X2 + yn X a1 (l,n) + Ya2 (l,n),

(2)

Xm + Уі = X,

+Y

ai (m,l) a2 (m,l)’

Xm + yl = Xa1 (m,l) + Ya2 (m,l),

Хт + Уп Х(т,п) + ^*2 (т,п)'

Эту систему мы будем называть основной системой обратной задачи. Она представляет собой систему однородных уравнений относительно х, у, X и Y .

Способ решения системы (2) в общем виде в этой статье не затрагивается. Однако приведем алгоритм решения для 2 х п -игры.

Основная система для 2 х п -игры примет вид:

хі + уі = Ха1 (1,1) + Ya.1 (1,1),

(З)

X1 + y2 X a1 (1,1) + Ya2 (1,1),

X1 + У n Xai (l,n) + Ya2 (l,n), X1 + yi = X a1 (1,1) + Ya2 (1,1), X1 + yl = X a1 (1,1) + Ya 2 (1,1),

Х2 + Уп = Х а1 (2,п) + Уа2 (2,п).

Обратимся к нахождению решений этой системы. Вычитание соответствующих уравнений первого и второго столбца в (3) дает:

Х1 - х2 = Ха1(и) - Ха1 (2у) + Уа2 (и) - Уа2 (2у)

или

(i = 1,2, ...и),

Ya2 (l,j) Ya2 (l,j) X1 X1 Xai (l,j)+ Xai (l ,j)

(4)

Каждую подсистему уравнений из (4) будем называть циклом. Длина цикла по определению равна k. Цикл длины 1 состоит из одного уравнения, в котором а 2 (1, j) = a 2 (2, j).

Очевидно, что условия разрешимости основной системы получаются из того замечания, что сумма левых частей в цикле равна нулю. Это дает однородную систему уравнений относительно x и X. Условие разрешимости последней есть некоторое линейное соотношение между t и T, где t = Xj - x2, T = Xj - X2. Если циклов несколько, то получаем несколько подобных соотношений.

Проиллюстрируем изложенный метод на примере 2 х 3 -игры.

4. Пусть одно из решений описывается следующей матрицей

Г1 2 3 1 A = .

I4 5 6J

Как было отмечено выше, величины выигрышей особого значения не имеют, а потому обозначим их символами 1,2,3 и т.д.

А priori для A' возможны 6! случаев. Однако преобразования 1-3 и, при необходимости, перенумерация выигрышей в A позволяют нам ограничиться следующими вариантами для A': Г1 2 3^1 Г1 2 °1 Г1 2 о'А

1)

ooo

, 2)

З

и З)

З

где

символом о обозначены элементы второй строки 4, 5 и 6. Итого имеем 18 вариантов. Остановимся на одном из них,

(1 2 41

5 б 3

X2 + yi = X1 + ^,

X2 + У2 = X 2 + Y1, (5) x1 + y3 = X 2 + y2 .

(і = 1,2,...п).

При необходимости, меняя знаки в левых частях уравнений, разобьем систему на подсистемы вида:

^ - Yi2 = ^1(х1 “ Х2) + Ц1(Х 1 “ Х 2 ),

Y2 - ^ = ^2 (Х1 - Х2 ) + Ц2 (Х 1 - Х2 ),

^к—1 _ ^к = ^к-1 (Х1 - Х2) + Цк-1 (Х 1 - Х2 ),

^ - Yi1 = ^к (Х1 - Х2) + Цк (Х 1 - Х 2 X

где Х1 = +1; Ці = ±1.

А ' =

Система (3) примет вид

х1 + у1 = Х1 + Y1, х1 + У2 = Х1 + ^

х1 + уз = Х 2 + Y3,

Из неё получаем

х1 -х2 = Y1 - Y3 = Х1 -Х2 + Y2 - Y1 = Y3 - Y2. (6)

Перепишем уравнения (6) в цикл:

1^1 - ^ = х1 - х2 ,

Yз — Y2 = Х1 — Х2,

Y2 — Yl = Х1 — Х2 — Х1 + Х 2. Условием разрешимости будет Х1 - Х2 = = 3 • (х1 - х2), или t = 3Т, где t = х1 - х2, Т = = Х1 -Х 2.

Полагаем Х2 = С1 и Y3 = С2. Отсюда матрица вероятностей (после перехода к экспонентам) примет вид

'J о

о о

B' = I М

(e 4t+Ci +C2 e lt+Ci +C2

t+Ci +C2 -1+Ci +C2

e 12 e e

e3t+Ci +C2 Л C1 +C2

(7)

V- у

где знаменатель нормирующего множителя

^м) есть сумма всех элементов матрицы. В

действительности С1 и С2 в (7) исчезают, и В' можно записать как

1 (я4 я2 я,31 Я я-1 1

B' = -

м

1 (Я4 я1 B = -

м

1

Л

V

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

р =1 (я,4 + А,2 +1; Я,3 + Я + Я-1),

Ц

ц =1 (Я4 + Я3; Я2 + Я1; 1+ Я-1),

Ц

ц = Я4 + Я3 + Я2 + Я +1 + Я-1 - наборы вероятно-

стей стратегий соответственно первого и второго игрока.

В силу того, что решения А и А ' имеют разные наборы вероятностей стратегий, очевидно, что они относятся к разным классам.

ЯЗ Я1 Я-1

Изложенный метод позволяет эффективно вычислять количество классов h. Правда, при этом приходится рассматривать достаточно большое число вариантов для гипотетических решений, описываемых матрицами типа В'.

Этот перебор вариантов был выполнен для 2 х 3 -игры двух игроков, и оказалось, что имеется два класса решений с представителями

, (1 2 31 (1 2 41

А =

4 5 6 у

где Я = е‘. Вероятности стратегий игроков таковы:

Р ’ =1 (я4 + Я2 + Я3; Я + Я-1 +1),

Q' = - (Я4 + Я; Я2 + Я-1; Я3 +1).

Здесь ц = Я4 + Я3 + Я2 + Я +1 + Я-1.

Исходная матрица вероятностей тогда примет вид:

v. - „у ^ б 3 у

и соответствующие им матрицы вероятностей

(Я4 я1 о

B = -

м

ЯЗ Я Я-1

4

Я4 Я1 Я3

Я Я-1 1

З

(Я *-).

Если статистика (вероятности) не приводит к выписанным матрицам В , то решения образуют 1 класс (все решения, эквивалентные фикси-

(1 2 31

рованному решению А =

4Зб

).

Список литературы

1. Матричные игры: сб. переводов / Под ред. Н.Н. Воробьева. М.: Государственное издательство физико-математической литературы, 1961. 280 с.

2. Воробьев Н.Н. Основы теории игр. Бескоалиционные игры. М.: Наука. Главная редакция физикоматематической литературы, 1984. 496 с.

3. Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр. М.: Высш. шк., 1998. 304 с.

4. Верещагина Е.И. О единственности решения обратной задачи антагонистической игры с различными элементами платёжной матрицы // Труды Нижегородского государственного технического университета им. Р.Е. Алексеева. 2011. № 1 (86). С. 346-352.

ON AN INVERSE PROBLEM OF GAME THEORY E.I. Vereshchagina

The inverse problem of a two player m x n — game is considered. It is assumed that the payoff matrix consists of different elements and the win probabilities are known. The notion of equivalent solutions is introduced. These solutions can be obtained from each other by the permutation of rows (columns) and payoffs with equal probabilities. A procedure to calculate the number of equivalence classes is given.

Keywords: inverse problem, payoff matrix, win probabilities.

i Надоели баннеры? Вы всегда можете отключить рекламу.