Научная статья на тему 'Методика решения биматричных игр с помощью равновесия Дж. Нэша'

Методика решения биматричных игр с помощью равновесия Дж. Нэша Текст научной статьи по специальности «Экономика и бизнес»

CC BY
1919
127
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
StudNet
Область наук
Ключевые слова
теория игр / стратегии игроков / выигрыш / равновесие Нэша. / game theory / player strategies / winning / Nash equilibrium

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Масленникова Екатерина Александровна

в статье раскрыто определение «Теория игр». Приведены основные группы игр. Кроме этого рассмотрен пример решения биматричной игры с помощью равновесия Нэша.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A METHOD FOR SOLVING BIMATRIX GAMES WITH EQUILIBRIUM JOHN.NASH'S

the article reveals the definition of "game Theory". The main groups of games are shown. Besides the example of solving bimatrix games with Nash equilibrium.

Текст научной работы на тему «Методика решения биматричных игр с помощью равновесия Дж. Нэша»

МЕТОДИКА РЕШЕНИЯ БИМАТРИЧНЫХ ИГР С ПОМОЩЬЮ

РАВНОВЕСИЯ ДЖ.НЭША

A METHOD FOR SOLVING BIMATRIX GAMES WITH EQUILIBRIUM

JOHN.NASH'S

УДК 004.421

Масленникова Екатерина Александровна, Студент, 2 курс, Департамент магистратуры ФГБОУ ВО Уральский государственный экономический университет. Россия, г. Екатеринбург

Maslennikova Ekaterina Aleksandrovna, Student, 2nd year, master's degree Department Ural state University of Economics. Russia, Yekaterinburg

Аннотация: в статье раскрыто определение «Теория игр». Приведены основные группы игр. Кроме этого рассмотрен пример решения биматричной игры с помощью равновесия Нэша.

Abstract: the article reveals the definition of "game Theory". The main groups of games are shown. Besides the example of solving bimatrix games with Nash equilibrium.

Ключевые слова: теория игр, стратегии игроков, выигрыш, равновесие

Нэша.

Keywords: game theory, player strategies, winning, Nash equilibrium.

ВВЕДЕНИЕ

В текущий момент многие решения в производственной, экономической или коммерческой деятельности зависят от субъективных качеств лица, принимающего решение. При таком способе выбора решений в условиях неопределенности всегда возникают риски, которые сложно или вовсе невозможно избежать.

Чтобы рассчитать и сократить возможные риски в условиях частичной или полной неопределенности при принятии решения необходимо воспользоваться моделями теории игр, наиболее подходящими для каждой конкретной задачи, которые позволяют рассмотреть все возможные варианты поведения обеих сторон и рассчитать наиболее выгодные исходы для каждой из сторон.

Для выбора наиболее подходящей модели для каждой определенной ситуации рассмотрим существующие модели теории игр.

ОПИСАНИЕ МЕТОДОВ ТЕОРИИ ИГР

Теория игр - это математическая теория конфликтных ситуаций. Основными ограничениями этой теории являются предположение о полной или «идеальной» разумности противника и принятие при разрешении конфликта наиболее осторожного «перестраховочного» решения.

В теории игр игрой называют возможные варианты поведения обеих сторон и их исходов для каждого сочетания альтернатив и состояний можно представить в виде математической модели. Обе стороны конфликта не могут точно предсказать взаимные действия. Несмотря на такую неопределенность, принимать решения приходится каждой стороне конфликта.

В зависимости от причин, вызывающих неопределенность исходов, игры можно разделить на следующие основные группы:

1. Комбинаторные игры. Игры, в которых правила в принципе дают возможность каждому игроку проанализировать все разнообразные варианты поведения и, сравнив эти варианты выбрать из них наилучший. Неопределенность здесь состоит в слишком большом количестве вариантов, которые надо проанализировать.

2. Азартные игры. Игры, в которых исход оказывается неопределенным в силу влияния случайных факторов.

3. Стратегические игры. Игры, в которых неопределенность исхода вызвана тем, что каждый из игроков, принимая решение, не знает, какой стратегии будут придерживаться другие участники игры, так как отсутствует информация о последующих действиях противника (партнера).

4. Парные игры. Игра называется парной, если в игре участвуют два игрока.

5. Множественные игры. Игра называется множественной, если в игре участвуют больше двух игроков.

6. Игра с нулевой суммой. Игра называется с нулевой суммой, если каждый игрок выигрывает за счет других, а сумма выигрыша и проигрыша одной стороны равны другой.

7. Антагонистическая игра. Парная игра с нулевой суммой называется антагонистической игрой.

8. Конечная игра. Игра называется конечной, если у каждого игрока имеется только конечное число стратегий. В противном случае - игра бесконечная.

9. Одношаговая игра. Игра, когда игрок выбирает одну из стратегий и делает один ход.

10. Многошаговая игра. В многошаговых играх игроки для достижения своих целей делают ряд ходов, которые могут ограничиваться правилами игры

или могут продолжаться до тех пор, пока у одного из игроков не останется ресурсов для продолжения игры.

Проведение классификации и группировки игр позволяет для конфликтных ситуаций найти общие методы поиска альтернатив в принятии решения, выработать рекомендации по наиболее рациональному образу действий в ходе развития конфликтных ситуаций в различных сферах деятельности.

Как правило, во время конфликта стороны стараются придерживаться наиболее выигрышной для себя стратегии, но это не гарантирует получение наибольшего выигрыша.

ПОСТАНОВКА ЗАДАЧИ

Приведем пример задачи и решим ее с помощью равновесия по Нэшу: «В отрасли имеются две фирмы №2 1 и №2 2. Каждая из фирм может установить два уровня цен: «высокие» и «низкие». Если обе фирмы выберут высокие цены, то каждая будет иметь прибыль по 3 млн. Если обе выберут низкие, то каждая получит по 2 млн. Однако, если одна выберет высокие, а другая низкие, то вторая получит 4 млн, а первая только 1.»

Равновесие по Нэшу - концепция решения, одно из ключевых понятий теории игр. Так называется набор стратегий в игре для двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив свою стратегию, если другие участники своих стратегий не меняют.

РЕШЕНИЕ ПОСТАВЛЕННОЙ ЗАДАЧИ

Так как в данной биматричной игре интересы игроков не совпадают, необходимо построить такое решение, которое могло бы в том или ином, но в одинаковом смысле удовлетворяло бы обоих игроков.

Рассмотрим случай, когда у игроков имеется ровно две стратегии, то есть установить высокую или низкую цену на товар (т=п=2).

В 2x2 биматричной игре платёжные матрицы игроков имеют следующий

вид:

A=(); B=()

Вероятности р1=р, р2=1-р, q1=q, q2=1-q, а средние выигрыши вычисляются по формулам:

Инф, q) = a11p q + a12 p(1-q) + a21(1-p)q + a22(1-p)(1-q),

(1)

ИЬф, q) = Ы^ + Ь12 p(1-q) + b21(1-p)q + b22(1-p)(1-q),

(2)

где 0 < р < 1, 0 < q < 1,

Пара чисел (p*,q*), 0 < p* < 1, 0 < q* < 1, p и q, подчиненных условиям 0 < p* <1, 0 <q* <1, одновременно выполнены следующие неравенства HA(p,q*) < HA(p*, q*).

Выдвинем гипотезу, что всякая биматричная игра имеет хотя бы одну равновесную ситуацию (точку равновесия) в смешанных стратегиях.

Задание смешанной стратегии игрока состоит в указании тех вероятностей, с которыми выбираются его первоначальные стратегии.

Если некоторая пара чисел (p*,q*) претендуют на то, чтобы определить ситуацию равновесия, то необходимо проверить справедливость неравенств. Для этого воспользуемся теоремой:

Выполнение неравенств 1, 2 равносильно выполнению неравенств: HA(0,q*) < HA(p*,q*), HB(p*,0) < HB(p*,q*) (3), HA(1,q*) < HA(p*,q*), HB(p*,1) < HB(p*,q*) (4). Запишем средние выигрыши игроков А и В в более удобной форме. Имеем:

HA(p, q) = (all - a12 - a21 + a22)*pq + (a12 - a22)*p + (a21 - a22)*q + a22

(5),

HB(p, q) = (b11 - b12 - b21 + b22)*pq + (b12 - b22)*p + (b21 - b22)*q + b222 (6).

Обратимся к первой формуле. Пологая p = 1, а потом p = 0, получаем,

что

HA(1, q) = (a11 - a12 - a21 + a22)*q + a12 + (a21 - a22)*q

(7),

HA(0, q) = (a21 - a22)*q + a22 (8)

Рассмотрим разности

HA(p, q) - HA(1, q) = (a11 - a12 - a21 + a22)*pq + (a12 - a22)p - (a11 - a12 - a21 + a22)*q + a22 - a12 (9),

ИЛ(р, q) - HA(0, q) = (a11 - a12 - a21 + a22)*pq + (a12 - a22)p

(10)

Пологая C = a11 - a12 - a21 + a22, a = a22-a12, получим HA(p, q) - HA(1, q) = Cpq - ap - Cq + a = (p-1)*(Cq-a)

(11),

HA(p, q) - HA(0, q) = Cpq - ap = p*(Cq-a) (12)

В случае, если пара (p,q) определяет точку равновесия, эти разности неотрицательны, поэтому: (p-1)*(Cq-a) > 0, p*(Cq-a) > 0

Из формул для функции HB(p,q) при q=1, q=0 соответственно имеем:

НВ(р, 1) = (Ъ11 - Ъ12 - Ь21 + b22)*p + (Ь12 - b22)*p + Ъ21

(12),

НВ(р, 0) = (Ъ12 - Ъ22)*р + Ъ22 (13)

Разности НВ(р, д) - НВ(р, 1) и НВ(р, д) - НВ(р, 0) С учётом обозначений D = Ь11-Ъ12-Ь21+Ь22, в = Ь22-Ъ21 Приводятся к виду НЬ(р, q) = НЬ(р, 1) = ^-1)фр-Р), НЪ(М) = НЪ(р,0) = дфр-Р). И (^1)фр-Р) > 0, q(Dp-P) > 0

В каждом столбце матрицы найдем максимальный элемент. Их положение соответствует приемлемым ситуациям 1-го игрока, когда второй игрок выбрал стратегию j соответственно.

Затем в каждой строке матрицы В выберем наибольший элемент. Эти элементы подчеркнуты в матрице В. Их положение будет определять приемлемые ситуации 2-го игрока, когда первый игрок выбрал стратегию i соответственно.

Составим платежную матрицу для двух игроков:

Таблица 1

Платежная матрица игрока А

Низкая цена Высокая цена

Низкая цена 2 4

Высокая цена 1 3

Таблица 2

Платежная матрица игрока В

Низкая цена Высокая цена

Низкая цена 2 1

Высокая цена 4 3

Позиции максимумов в строках матрицы В: (1,1), (2,1) Пересечение этих двух множеств: (1;1),

Таким образом, найдены 1 равновесные ситуации по Нэшу (1;1). Эти ситуации оказались оптимальные по Парето для обоих игроков.

В равновесной ситуации (1,1) игрок 1 выигрывает 2 единиц, а игрок 2 -2 единицы.

Если биматричная игра не имеет равновесных ситуаций в чистых стратегиях, то она неразрешима в чистых стратегиях. И тогда можно искать решение в смешанных стратегиях.

Итак, чтобы в биматричной игре: А=(а), В = (Ь) пара (р^);

Определяемая равновесная ситуация, необходимо и достаточно одновременное выполнение следующих неравенств: (р-1)(Сд-а) > 0, р^-а) > 0; 0 < р < 1 (д-1)(Ор-Р) > 0, q(Dp-P) > 0; 0 < q < 1 где

С = а11 - а12 - а21 + а22 а = а22- а12 В = Ь11-Ь12-Ь21+Ь22 в = Ь22-Ь21

Проводя необходимые вычисления: С = 2 - 4 - 1 + 3 = 0 а = 3 - 4 = -1 В = 2 - 1 - 4 + 3 = 0 в = 3 - 4 = -1 и рассуждения (р-1)*^+1) > 0 р*^+1) > 0 (д-1)*(0р+1) > 0 q*(0p+1) > 0

Откуда q=-1. Поскольку 0 < q < 1, то принимаем q=0. Откуда р=-1. Поскольку 0 < р < 1, то принимаем р=0. получаем, что:

1) р=1д > 0 р=0, q < 0

0 < р < 1, q=0

2) q=1,p > 0 q=0, р < 0

0 < q < 1, р=0

Игра имеет три равновесных ситуации с соответствующими выигрышами:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1) р=1, д=0, Н1(1,0)=2, Н2(0,1)=2

2) р=0, д=1, Н1(0,1)=3, Н2(1,0)=3

3) р=0, д=0, Н1(0,0)=3, Н2(0,0)=3

Из этих трех смешанных стратегий лучшей является р=3, q=3. Наиболее выигрышный в сумме вариант — одновременный выбор высоких цен (сумма = 6 млн). Однако это состояние нестабильно из-за возможности относительного выигрыша, которая открывается перед фирмой, отступившей от этой стратегии. Поэтому обе компании с наибольшей

вероятностью выберут низкие цены. Хотя этот вариант и не дает максимального суммарного выигрыша (сумма=4 млн.), он исключает относительный выигрыш конкурента, который тот мог бы получить за счет отступления от взаимно-оптимальной стратегии. Такая ситуация и называется «равновесием по Нэшу».

ВЫВОДЫ

Таким образом, наиболее выигрышный в сумме вариант — одновременный выбор высоких цен (сумма = 6 млн). Однако это состояние нестабильно из-за возможности относительного выигрыша, которая открывается перед фирмой, отступившей от этой стратегии. Поэтому обе компании с наибольшей вероятностью выберут низкие цены. Хотя этот вариант и не дает максимального суммарного выигрыша (сумма=4 млн.), он исключает относительный выигрыш конкурента, который тот мог бы получить за счет отступления от взаимно-оптимальной стратегии. Такая ситуация и называется «равновесием по Нэшу».

СПИСОК ЛИТЕРАТУРЫ

1. [1] Кремлев А.Г. Основные понятия теории игр, метрология: учеб. пособие. [Текст] - Екатеринбург : Изд-во Урал. ун-та, 2016.— 144 с.

2. [2] Захаров А.В. Теория игр в общественных науках. [Текст] - Изд. Дом Высшей школы экономики, 2015. - (Учебник Высшей школы экономики). - 304 с. - 1500 экз. - ISBN 978-5-7598-1180-0 (в пер.).

3. [3] Костромин А.В, Мухаметгалеев Д.М. Теория игр. [Текст] - Казань, 2013. -87 с.

4. [4] Статья «Основные понятия теории игр» [Электронный ресурс]. -Режим доступа: https://studopedia.org/9-135392.html;

5. [5] Статья «Применение метода теории игр для решения экономических задач» [Электронный ресурс]. - Режим доступа: https: //cyberleninka.ru/article/v/primenenie-metoda-teorii-igr-dlya-resheniya-ekonomicheskih-zadach;

6. [6] Статья «Модели, применяемые для реализации технологий виртуального прототипирования» [Электронный ресурс]. - Режим доступа:

http://referatwork.ru/category/tehnologii/view/484969_modeli_teorii_igr;

7. [7] Статья «Равновесие по Нэшу. Теория игр для экономистов (Джон Нэш) - Читайте подробнее на FB.ru: http://fb.ru/article/199282/ravnovesie-po-neshu-teoriya-igr-dlya-ekonomistov-djon-nesh» [Электронный ресурс]. -

Режим доступа: http://fb.ru/article/199282/ravnovesie-po-neshu-teoriya-igr-dlya-ekonomistov-djon-nesh;

8. [8] Статья «Равновесие Нэша. Теория Джона Нэша» [Электронный ресурс]. - Режим доступа: https://academypoker.ru/mathematics/1222-nashequilibrium.html.

BIBLIOGRAPHY

1. [1] Kremlin A.G. The basic concepts of game theory, metrology: textbook. allowance. [Text] - Yekaterinburg: Publishing House Ural. University, 2016 .-- 144 p.

2. [2] Zakharov A.V. Game theory in the social sciences. [Text] - Ed. House of the Higher School of Economics, 2015. - (Textbook of the Higher School of Economics). - 304 p. - 1,500 copies - ISBN 978-5-7598-1180-0 (trans.).

3. [3] Kostromin A.V., Mukhametgaleev D.M. Game theory. [Text] - Kazan, 2013. -87 p.

4. [4] Article "Basic concepts of game theory" [Electronic resource]. - Access mode: https://studopedia. org/9-135392.html;

5. [5] Article "Application of the game theory method for solving economic problems" [Electronic resource]. - Access mode: https://cyberleninka.ru/article/v/primenenie-metoda-teorii-igr-dlya-resheniya-ekonomicheskih-zadach;

6. [6] Article "Models used for the implementation of virtual prototyping technologies" [Electronic resource]. - Access mode: http://referatwork.ru/category/tehnologii/view/484969_modeli_teorii_igr;

7. [7] Article "Nash Equilibrium. Game Theory for Economists (John Nash) -Read more on FB.ru: http://fb.ru/article/199282/ravnovesie-po-neshu-teoriya-igr-dlya-ekonomistov-djon-nesh "[Electronic resource] . - Access mode: http://fb.ru/article/199282/ravnovesie-po-neshu-teoriya-igr-dlya-ekonomistov-djon-nesh;

8. [8] Article "Nash Equilibrium. Theory of John Nash "[Electronic resource]. -Access mode: https://academypoker.ru/mathematics/1222-nashequilibrium.html.

i Надоели баннеры? Вы всегда можете отключить рекламу.