Научная статья на тему 'Статистический подход к решению обратной задачи в теории игр'

Статистический подход к решению обратной задачи в теории игр Текст научной статьи по специальности «Математика»

CC BY
114
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБРАТНАЯ ЗАДАЧА / INVERSE PROBLEM / ПЛАТЁЖНАЯ МАТРИЦА / PAYOFF MATRIX / ВЕРОЯТНОСТИ ВЫИГРЫШЕЙ / WIN PROBABILITY / ПОЛИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ / POLYNOMIAL DISTRIBUTION / ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ / CONFIDENCE INTERVAL / ДОВЕРИТЕЛЬНАЯ ВЕРОЯТНОСТЬ / CONFIDENCE PROBABILITY / МАКСИМАЛЬНОЕ ПРАВДОПОДОБИЕ / MAXIMUM LIKELIHOOD

Аннотация научной статьи по математике, автор научной работы — Верещагина Е.И.

В статье рассматривается задача восстановления платежной матрицы для 2 х 2 игры по статистике достаточно длинной серии реализаций игры. Строятся доверительные интервалы и доверительные вероятности для игры, в которой все выигрыши различны. Обсуждается пример, где пара выигрышей совпадает. Для него проверяется гипотеза об оптимальности игры.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Statistical approach to the solving of the inverse problem of the games theory

Purpose: In works [1]. [2] the inverse problem of a two player m x п games was investigated. In this article the task of restoring the payoff matrix for 2 x 2 games for statistics sufficient long series of the realizations of the game is considered. Design/methodology/approach: Statistical methods are used. Findings Confidence intervals and confidence probabilities for the game in which the payoff matrix consists of different elements are built. The example. where the pair of wins coincides. is discussed. The hypothesis about the optimality of game is checked for it. Research limitations/implications: The present study provides a starting-point for further research in the game theory. Originality/value: These results are new.

Текст научной работы на тему «Статистический подход к решению обратной задачи в теории игр»

МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ЕСТЕСТВЕННЫХ, ТЕХНИЧЕСКИХ И СОЦИАЛЬНЫХ НАУКАХ

УДК: 519.81/.83

Е.И. Верещагина

СТАТИСТИЧЕСКИЙ ПОДХОД К РЕШЕНИЮ ОБРАТНОЙ ЗАДАЧИ

В ТЕОРИИ ИГР

Нижегородский государственный технический университет им. Р.Е. Алексеева

В статье рассматривается задача восстановления платежной матрицы для 2 х 2 — игры по статистике достаточно длинной серии реализаций игры. Строятся доверительные интервалы и доверительные вероятности для игры, в которой все выигрыши различны. Обсуждается пример, где пара выигрышей совпадает. Для него проверяется гипотеза об оптимальности игры.

Ключевые слова: обратная задача, платёжная матрица, вероятности выигрышей, полиномиальное распределение, доверительный интервал, доверительная вероятность, максимальное правдоподобие.

В работах [1], [2] автором был сформулирован один из вариантов обратной задачи для антагонистической m х n — игры двух лиц. Под ним автор понимает восстановление платежной матрицы A = (аг>) вместе с вероятностями p,р2,...,pm и q,q2,...,qn стратегий игроков по известному множеству b е B}, элементами которого являются частоты (вероятности) появления выигрышей a. Впрочем, достаточно ограничиться восстановлением матрицы вероятностей B = Ь ), каждый элемент которой btj = pq^ и есть вероятность выигрыша а1}, т.к. рг = £b%] , q}. = £ьг] .

] г

Предполагается, что игроки применяют смешанные стратегии, где все стратегии активны. Последнее условие естественно, так как стратегии с нулевыми вероятностями в игре не используются и их исключение из рассмотрения просто меняет формат игры.

Исследование именно этого варианта обратной задачи вызвано следующим соображением. В длинной серии реализации игры сторонний наблюдатель фиксирует исходы (выигрыши) реализаций. Частоты появлений выигрышей, как известно из математической статистики, дают хорошие приближения к их вероятностям. Тем самым наблюдатель находится в ситуации, описываемой обратной задачей.

В работах [1], [2] автором были поставлены и частично решены вопросы существования и единственности решений.

В этой статье исследуется точность статистической оценки для случая 2 х 2 — игры, где не требуется громоздких вычислений.

Предполагается, что выигрыши можно различить друг от друга.

Однако не следует исключать возможности наличия одинаковых выигрышей. Несмотря на то, что они могут иметь разные вероятности, наблюдатель фиксирует их как один и тот же выигрыш, т.е. он в качестве исходной информации располагает суммой вероятностей одинаковых выигрышей. Соответствующий пример приведен далее.

© Верещагина Е.И., 2014.

Следуя приведенной мотивировке обратной задачи, в серии из п повторений игры выигрыши V, , у3 , встречаются соответственно п, Щ, Щ, П раз (П + П + П + П = п), т.е.

п Щ Щ п. известны частоты ^ =—, =—, =—, ц4 =— их появления.

п п п п

Из теории вероятностей известно, что случайные величины п, п2, пъ, п4 имеют полиномиальный закон распределения:

Р = Рп(п17щ) =--Рп ...рп,

где Р1 + ...Рк = 1,

п + п2 +... + щ = п.

Поскольку на практике объем п велик, то аппроксимацией является распределение Гаусса:

-(х2+...+х\ )/2

Р ^ 6------(1)

где хг =

(42п)^Р ••• Рк

п - пР

г г

№ '

Для 2 х 2 - игры формула (1) примет вид

-(х12 + х22 + Х32+Х42 )/2

Р = 6

(42ЛпУд/Р1 • Р • Рз • Р4

п - пР где хг = ' , ' .

' ^Р

Неизвестные параметры Р, Р2, Р3, Р4 (р > Р2 > Р3 > Р4) можем найти, применяя метод наибольшего правдоподобия.

Составим функцию правдоподобия:

Р«1 • Р2«2 • Рпз • р«4 ^ тах,

учитывая, что

Р1 + Р2 + Рз + Р4 = 1 и Р1Р4 - Р2 Рз = 0 .

Последнее условие РР - РР = 0 есть требование, которому должны удовлетворять исходные данные при решении обратной задачи 2 х 2 - игры [2]. Найдем логарифмическую функцию правдоподобия:

п 1п Р + п 1п Р + п 1п Р + п41п Р ^ тах,

при условиях

Р1 + Р2 + Рз + Р4 = 1, (2)

и Р Р4 - Р2 Рз = 0 . Задача (2) решается стандартным методом множителей Лагранжа. Составляем функцию Лагранжа:

Ь = п 1пР + п2 1пР + п 1пР + п 1пР - ^ (Р + Р + Р + Р -1)-Х2 (РР - РР ). Необходимые условия экстремума сводятся к системе шести уравнений:

^ = а _ h _ P4 = 0,

dP1 P1 1 24

^ = _ h + х2 P3 = 0,

SP2P2

^ = _ ^ + х2 P2 = 0,

^ P3 1 2 2 '

^="44- _ h _ Х2 P1 = 0, 6P4 P4 1 21 '

Pl + P2 + P3 + Pt=1,

P1P4 _ P2 P3 = 0

с шестью неизвестными Р, Р2 , Р3, Р4, А,1з из которой можно, определить эти неизвестные:

нщ _ (щн4 _ н2н3 )

н2

_ (н1 + Н2 )(н2 + Н4 )

н2

нн3 + (н1Н4 _ н2 н3 )

Н Н

nn4 _(н1н4 _ Н2 Н3 )

(3)

н

\ = Н .

к =

(nn _ н2н3 )н3

(n + н2 )н2 + Н )(нщ + nn _ н2н3)

Приведем пример, иллюстрирующий методику оценки неизвестных параметров распределения.

Пример 1

Пусть платежная матрица с вероятностями выбора стратегий игроками такова:

( 1 -1,76 ^ 0,31

А =

ч-1,24 0,44

0 0,56

0,69.

Соответствующая ей матрица вероятностей:

(0,3864 0,3036^ В = .

^ 0,1736 0,1364J

Была смоделирована серия из п = 100 реализаций игры. Выигрыши

0, -1.24, -1.76, 1

появились соответственно в количестве

П = 37, п2 = 34, п = 15, п = 14 раз (п + П + П + П = п). Значения неизвестных параметров Р*, Р*, Р*, Р* находим по формуле (3)

Р* = 0,3692, Р2* = 0,3408, Р3* = 0,1508, Р4* = 0,1392. Учитывая, что Р1 * Р4* — Р2* Р3* = 0 матрица вероятностей примет вид

B' =

(0,3692 0,3408^

v 0,1508 0,1392j

2

3

4

Соответствующая ей платежная матрица с вероятностями выбора стратегий игроками

такова

А* =

( 0 -1,24 ^ 0,71

-1,76

Как

видно,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

V

0,52 место

1

у

0,29.

0,48

хорошее

(

т п~ П

-1 = 0,37; = 0,34; = 0,15;

= 0,14

с исходными

совпадение вероятностями

статистики

выигрышей

имеет

- - - -

р = 0,3864; р = 0,3036; р = 0,1736; р = 0,1364, которые использовались при моделировании примера.

Замечание 1. Решение обратной задачи, т.е. восстановление платежной матрицы А"

* * * * »_»

вместе с вероятностями р*, р* и д*, д* стратегий игроков получено с точностью до эквивалентности, т.е. перестановке строк (столбцов) в матрице А* [2].

В случае, если значения р, р , р, р заранее неизвестны и хотелось бы указать интервалы (р.* — в, р* + в) V - = 1,4, в которых с заданной вероятностью содержатся р (- = 1,4), то обычно используют понятие доверительного интервала и доверительной вероятности.

Из математической статистики известно, что вероятность отклонения относительной частоты от постоянной вероятности в независимых испытаниях равна

п

рд

р(цг — р| < в) = 2Ф

(

в.

Л

=2Ф(*)=у,

у

где

1*2

ф(х) = .— [ е- функция Лапласа.

А искомый доверительный интервал (р1, 2), который с надежностью у покрывает оцениваемый параметр р (- = 1,4), находят по формулам

р1 =

п

р2 =■

Г2 + п

п

ц г + — - * 2п

1

Ц --

- (1 - Ц-),( *

п

+ V 2п у

и

(4)

*1

ц -+ т+' ■■

Ц

, (1 - Ц,)

+

п

2п

*2 + п

Используя формулы (4), найдем доверительные интервалы с надежностью у = 0,95 для каждой оценки вероятности р (- = 1,4), полученной в примере 1.

0,282 < р < 0,468, 0,255 < р < 0,437, 0,093 < р < 0,233 , 0,085 < р < 0,221.

Отсюда видно, что построенный интервал в каждом из четырех случаев накрывает неизвестный параметр р . Надежность вывода равна 0,95.

Если некоторые выигрыши совпадают, то ситуация усложняется. Возможно бесконечное множество решений обратной задачи, поэтому для уменьшения числа вариантов надо добавить дополнительную информацию.

Проиллюстрируем эту ситуацию на следующем примере.

2

2

2

Пример 2

Таблица 1

Выигрыши и частоты появления выигрышей

Выигрыши 0 3 5

Частота появления выигрыша 0,48 0,36 0,16

Проверим, согласуются ли эти экспериментальные данные с гипотезой об оптимальности игры.

С точностью до эквивалентности [2] возможны следующие варианты расположения выигрышей 0,3,5 в платежной матрице:

(3 0^

2) А =

1) а =

3) Аз =

5) А5 =

0 5

Г 0

3

3 1 5

Г 0 5 1 5 3

4) A =

6) А6 =

Г 3 01

v 5 0,

Г0 31

v5 3,

Г0 31

v5 5,

Во всех случаях, за исключением первого и пятого, имеется седловая точка и оптимальная игра производится в чистых стратегиях. Реализация игры дает один и тот же выигрыш. Следовательно, статистика нашего примера отвергает эти возможности.

В первом случае платежная матрица и вероятности выбора стратегий игроками с учетом условия оптимальности выглядит так:

А =

Г 3 01 5/8

v 0 5 У 3/8

5 3

8 8

Теоретические вероятности выигрышей (табл. 2).

Выигрыши и теоретические вероятности появления выигрышей

Таблица 2

Выигрыши 0 3 5

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Вероятность появления выигрыша 0,468 0,391 0,141

Как видно, гипотезу об оптимальности игры следует принять. Оптимальное решение игры с платежной матрицей

(0 5 1

А5 =

5 5 3 V 5 3 У

таково:

Р' = (2/7,5/7); 0* = (2/7,5/7), V = 25/7 . Из табл. 3, в которой представлены теоретические вероятности выигрышей видно, что данное решение обратной задачи не соответствует оптимальному поведению игроков и его следует отвергнуть.

Таблица 3

Выигрыши и теоретические вероятности появления выигрышей

Выигрыши 0 3 5

Вероятность появления выигрыша 0,082 0,51 0,408

Библиографический список

1. Верещагина, Е.И. Об одной обратной задаче теории игр // Вестник Нижегородского университета им. Н.И. Лобачевского / Издательство Нижегородского госуниверситета. - Н. Новгород, 2013. №4 (1). С. 194-198.

2. Обратная задача в теории 2 х 2 — игр // Управление экономическими системами: электронный научный журнал. 2014. №2 (62)

3. Верещагина, Е.И. О единственности решения обратной задачи антагонистической игры с различными элементами платёжной матрицы // Труды Нижегородского государственного технического университета им. Р.Е. Алексеева / НГТУ. - Н. Новгород, 2011. №1 (86). С.346-352.

4. Bohnenblust, H.F. Karlin S., Shapley L.S. Solutions of discrete two-person games, Contributions to the theory of games 1 (1950), Princeton, 51-72.

(Имеется русский перевод в сборнике Матричные игры: сб. переводов; под ред. Н.Н. Воробьева. - М.: Государственное издательство физико-математической литературы, 1961. - 280 с.)

5. Петросян, Л.А. Теория игр / Л.А. Петросян, Н.А. Зенкевич, Е.В. Шевкопляс. - 2-е изд., пере-раб. и доп. - СПб.: БХВ-Петербург, 2012. - 432 с.

6. Гмурман, В.Е. Теория вероятностей и математическая статистика: учеб. пособие / В.Е. Гмур-ман. - 9-е изд., стер. - М.: Высш. шк., 2003. - 479 с.

Дата поступления в редакцию 06.07.2014

E.I. Vereshchagina

STATISTICAL APPROACH TO THE SOLVING OF THE INVERSE PROBLEM

OF THE GAMES THEORY

Nizhny Novgorod state technical university n.a. R.E. Alexeev

Purpose: In works [1], [2] the inverse problem of a two player m х n — games was investigated. In this article the task of restoring the payoff matrix for 2 х 2 — games for statistics sufficient long series of the realizations of the game is considered.

Design/methodology/approach: Statistical methods are used.

Findings Confidence intervals and confidence probabilities for the game in which the payoff matrix consists of different elements are built. The example, where the pair of wins coincides, is discussed. The hypothesis about the optimality of game is checked for it.

Research limitations/implications: The present study provides a starting-point for further research in the game theory. Originality/value: These results are new.

Keywords: inverse problem, payoff matrix, win probability, polynomial distribution, confidence interval, confidence probability, maximum likelihood.

i Надоели баннеры? Вы всегда можете отключить рекламу.