УДК 330.47
Власов Д.А., Синчуков А.В.
Российский экономический университет им. Г.В. Плеханова, г. Москва, Россия
РАВНОВЕСИЕ НЭША В БИМАТРИЧНЫХ ИГРАХ: ТЕХНОЛОГИЯ МОДЕЛИРОВАНИЯ И ВИЗУАЛИЗАЦИИ WOLFRAM DEMONSTRATION PROJECT
АННОТАЦИЯ
В центре внимания статьи - моделирование и визуализация равновесных состояний в теоретико-игровых моделях средствами Wolfram demonstration project. Представленные девять результатов практической реализации биматричных игр снабжены содержательными комментариями, раскрывающими сущность равновесия Нэша в каждой конкретной ситуации. Выделенные примеры множеств равновесных состояний описывают полный набор случаев проявления равновесия Нэша в биматричных играх.
КЛЮЧЕВЫЕ СЛОВА
Теория игр; платежная матрица; стратегия; оптимальная стратегия; биматричная игра; равновесие; визуализация; моделирование; математическая экономика; Wolfram.
Vlasov D.A., Sinchukov А.У.
Plekhanov Russian University of Economics, Moscow, Russia
NASH EQUILIBRIUM IN BIMATRIX GAMES: WOLFRAM DEMONSTRATION PROJECT TECHNOLOGY OF MODELING AND VISUALIZATION
ABSTRACT
The article concentrates on the modeling and visualization of equilibrium conditions in game-theoretical models with Wolfram demonstration project technologies. Nine main results of practical realization of bimatrix games are presented. Detailed comments which show the core of Nash's equilibrium in each case are presented. In a lot of examples different cases of Nash's equilibrium in bimatrix games are demonstrated.
KEYWORDS
Game theory; payoff matrix; strategy; optimal strategy; bimatrix game; balance; visualization; modeling; mathematical economics; Wolfram.
Теоретико-игровые модели занимают особое место в системе математических методов моделирования и прогнозирования экономики. Благодаря их возникновению в начале XX века и последующему развитию у исследователеи появился специфическии инструмент, позволяющии анализировать ситуации, характеризующиеся конкурентным взаимодеиствием нескольких субъектов, неполнотои информациеи, активизациеи рисков различнои природы [11]. Такие ситуации часто встречаются в экономике, финансах, политике. Ретроспективныи анализ возникновения и развития методов и моделеи теории игр представлен в статье [3]. Теория игр, представляющая особыи интерес благодаря своими культурно-историческим и философским аспектами (Йохан Хеизинг, Оиген Финк), ставшая неотъемлемои частью современнои экономическои кибернетики [6], стимулирует развитие методов и моделеи экономическои информатики.
Равновесие Нэша («Nash equilibrium») является фундаментальнои закономерностью классических (некооперативных) игр. Его сущность заключается в том, что при определенных и заранее известных правилах игры, в ситуации отсутствия коммуникации игроки приходят к седловой точке - точке устойчивого равновесия, которая может существенно отличаться от оптимальнои точки, достижимои при согласованных деиствиях [9]. В рамках теоретико-игровои концепции взаимодеиствия экономических субъектов, рынок развивается в направлении сговора олигополии, так как желание получать еще больше и больше никуда не исчезает, а без предварительных договоренностеи из равновесия по Нэшу выити невозможно. Понятие «Nash equilibrium» является не просто абстрактным термином, а важным теоретическим обобщением
множества реально существующих экономических закономерностей.
Классический пример моделирования взаимодействия «Prisoners dilemma» и его экономические аналоги [4] (игроки, деиствуя исключительно в собственных интересах, с большои вероятностью стремятся увеличить собственные выигрыши и таким образом не получат ничего или даже приобретут убытки) соответствуют стратегическои тенденции. Чем более специфическими являются соотношения значении элементов платежных матриц конкретнои биматричнои игры, тем наиболее вероятнее система игрового взаимодеиствия будет приводить участников игры к наихудшим вариантам. Таким образом проявляется «невидимая рука рынка», однако направлением является не всеобщее благо, а кризисная ситуация. Если в матричнои игре с двумя с игроками и двумя матрицами выигрышеи существует состояние, такое что при выборе не соответствующеи ему стратегии любым из игроков в отдельности его выигрыш уменьшится, то это состояние является «равновесным» для даннои игры [7]. Важно отметить, что при многократном повторении биматричнои игры в одних и тех же условиях последовательность стратегии участников игры приобретают тенденцию стремления к этому состоянию, даже если в этои модели присутствуют и другие множества комбинации стратегии (состояния), в рамках которых выигрыш игроков в целом или по отдельности выше.
С математическои точки социально-экономические ситуации, приводящие к биматричным играм, формализуются в виде двух платежных матриц, первая из которых содержит возможные выигрыши первого игрока, вторая матрица соответствует выигрышам второго игрока. Для рассматриваемо случая платежные матрицы имеют вид
A =
к a 21
Л
'22
B =
fb
21
О
'22 )
Элементы данных платежных матриц имеют содержательный экономический смысл - это выигрыши игроков, при этом отрицательное значение элемента матрицы означает «проигрыш», нулевое значение - «ничью» как результат игрового взаимодеиствия. Множества стратегии игроков
А = {Л1, А2 }, В = {В 1, В 2 }.
Существует два подхода к определению оптимальных (равновесных) стратегии игроков. Каждыи из подходов дополняет друг друга. Первыи, классическии подход - определение ситуации равновесия в виде чистых стратегий. Второи подход, разработанныи в математическои экономике гораздо позднее первого, подразумевает определение ситуации равновесия в виде смешанных стратегий. Смешанные стратегии являются обобщение чистых стратегии и реализуются, как правило, в условиях многократного повторения игры в одних и тех же условиях (условие применения аппарата теории вероятностеи). Смешанные стратегии для рассматриваемои игры имеют вид
S, =
S 2 =
f A1 A2Л
к x1 Х2 )
B1 B 2 Л
У1 У 2 )
, где x1 + x2 = 1, x1 > 0, x2 > 0 для первого игрока,
, где ^ 1 + ^2 = 1, ^ 1 > 0, y2 > 0 для второго игрока.
В случае, если одно из значении вероятностеи равно единице, получаем частныи случаи -чистую стратегию игрока. Обратимся к результату моделирования и визуализации равновесия Нэша, представленного на рис. 1. Полученным результатам моделирования предшествовала реализация соответствующего вычислительного процесса [10].
Множество М = |(0; 1), 3; (1; 0)| следует интерпретировать следующим образом:
Si =
A2 Л
0 1
Ч
S 2 =
1
B Л
V
0
S1 =
A2
0,6 0,4
4
S, =
f
S1 =
A2 Л
10
A1
S 2 =
0
V
В2Л 1
0,2
v
B2^ 0,8
Это означает, что рассматриваемая ситуация имеет три ситуации равновесия Нэша. Ситуация, представленная на рис. 2 демонстрирует, что в зависимости от начальных данных (элементов платежных матриц), множество равновесных ситуации может содержать разное число элементов. В данном случаеМ = {(1; 0)}, т.е. имеем единственное состояние равновесия, что
соответствует следующим чистым стратегиям игроков S1 =
A л2 л о (вх b2 Л
1 0
S2 =
01
elements of payoff matrix А
an —|- -5
312 ■-0- -3
321 -Q- -1
322 ■-Q- И -4
elements of payoff matrix E
bn —|- -5
bi2 —o- -3
tj2L ■-0- -1
b22 ■-0- D -4
payoff matrices A and Б
L 2
-5 , -5- -3 , -3 -1,-1 -4,-4
Bet of Nash equilibria
{{0.1}- {Н}Л1,°}}
Рис.1. Визуализация равновесия Нэша № 1
elements of payoff matrix A
ail -Q- D 8
a 12 -0-D ~3
321 -Q- ° -1
a22 -Q- D -4
elements of payoff matrix 8
bn —0- a -5
bi2 -0-° -3
b21 -0- o -1
b22 -Q- n -4
payoff matrices A and B
1 2
8,-5 -3,-3 -1,-1 -4,-4
Рис.2. Визуализация равновесия Нэша № 2 Множество M = \ (0; l), 3''! J' (l'0)| , представленное на рис. 3 следует
интерпретировать следующим образом ^ =
Ai A2 ï 0 r Bi B2 ï
О i
S 2 =
i О
elements of payoff matrix A
an —§- -5
a 12 ■-0- n 0
321 ■ 0 "L
322 ■-0- П -4
elements of payoff matrix Б
t>Ll —Q- -5
bi2 —0- -3
b21 .-0- -1
bu -Q- n -4
payoff matrices A and Б
1 2
-5,-5 0,-3 -1,-1 -4,-4
set of Nash equilibria
{R 1)0'}.(1.о}}
Рис.3. Визуализация равновесия Нэша № 3
Анализируя вторую пару стратегии ^ =
Ai A2 ï0 r Bi B2 ï
v О,6 О,4 J
,S 2 =
v 0,5 О,5у
следует обратить
внимание на интересныи результат: в этом случае стратегии В1 и В2 второго игрока являются
( а А2 Л ( В1 В2 Л
равновероятными и = 1 ^ , S2 =
i О
J
J
В результате рассмотрения следующего четвертого случая получено множество
М = -|(0; 1), —; (1; 0)| Его следует интерпретировать следующим образом
(А А Л (В В Л (А А Л (В В Л
Si =
О i
S2 =
J
Ji "2
i О
Si =
J
v
i ^2 О,6 О,4
S2 =
J
i О
J
Si =
Ai A2 ï 0 r Bi B2 ï
i О
S 2 =
J
О i
J
Si =
Одноэлементное множество М = {(0; 1)} следует интерпретировать следующим образом
А А Л
V
Ч ^2
О i
, S 2 =
'Bi B2 ï
J
v
i О
это единственное возможное равновесное состояние в
J
рассматриваемои ситуации.
Интересно, что изменение матриц игры А =
- 5 - 3Ï -i 5
, B =
- 5 - 3ï
v-. - 4J
на пару матриц
A =
- 5 - 3 ï
v -i - 4J
B =
- 5 - 3 ï
-i - 4
vJ
не оказало влияние на множества состоянии равновесия
биматричнои игры.
и
Множество M =
S =
0; i j, (0; 1), (l; 0)1 следует интерпретировать следующим образом
Л A2 j
0 1 у
S1
S 2 =
Ч B2 ^ JA a2 ^
v 0,2 0,8 у
V 0 1 у
S 2 =
Bi B2} 1 0
A1 A2 ^ 1 0
S 2 =
B
B2 ^
01
Множество М = {(1; 0)}, представленное на рис. 9 содержит только одно равновесное
следующим смешанным стратегиям игроков
состояние, что
^ A At
S1 =
х2
10
S 2 =
соответствует
rBx в 01
V " " J
elements of payoff matrix A
an —Q- a -5
312 -Q- n 8
321 -Q- O -1
322 -Q- " -4
elements of payoff matrix 8
bn —fl-a -5
bi2 —Q-n -3
b21 -Q-D -1
b22 —0-a -4
payoff matrices A and 8
1 2
-5,-5 8,-3 -1,-1 -4,-4
set of Nash equilibria
{{0, 1}, {1,0}}
Рис.4. Визуализация равновесия Нэша № 4
elements of payoff matrix A
ail —Q- о -5
a 12 -0- п -3
321 —о-П -5
«22 -0- о -4
elements of payoff matrix В
»11 —Q- n -5
b!2 -0- n -3
b21 -Q- О -1
Ь22 -Q- D -4
payoff matrices A and В
1 2 T -5,-5 -3 , -3 2 -5,-1 -4 , -4
0.2 0 4 06
set of Nash equilibria
{{0. 1}. {|.1}.{1.0>}
Рис.5. Визуализация равновесия Нэша № 5
elements of payoff matrix A
ail —Q- a -5
312 -0-° -3
321 -Q-a -1
a22 -Q— a 5
elements of payoff matrix B
»11 —Q-° -5
bi2 -[)-a -3
b2i -Q-n -1
b22 -Q- 0 -4
payoff matrices A and B 1 2
-5 , -5 -3 , -3 -1,-1 5,-4
Рис.6. Визуализация равновесия Нэша № 6
elements of payoff matrix A
an —Q-n -5
ai2 -0-B -3
a21 -0-° -1
a22 —0- « -4
elements of payoff matrix B
bn -Q— n 5
bi2 -g- o -3
b2l -0- n -1
b22 -Q- -4
payoff matrices A and B
1 2
-5,5 -3,-3 -1,-1 -4,-4
Рис7. Визуализация равновесия Нэша № 7
elements of payoff matrix A
an —Q- D -5
312 -Q- c -3
a2i -Q- ° -1
322 —Q- o -4
elements of payoff matrix 8
bll —0- o -5
bi2 -0- D -3
b2l -0- a -4
b22 -Q- D -4
payoff matrices A and B
1 2
r~ -5,-5 -3 , -3 2 -1,-4 -4, -4
Рис.8. Визуализация равновесия Нэша № 8
elements of payoff m3trix A
ail —0-n -5
a12 -Q- D -3
321 -0- 0 -1
322 -Q- n -4
elements of payoff matrix B
bll —0- U -5
bi2 -0- D -3
b21 -Q-a -1
b22 -0 a 9
payoff matrices A and B
1 2
1~ -5,-5 -3 , -3 2 -1,-1 -4,9
Рис.9. Визуализация равновесия Нэша № 9
Выводы
1. Технология Wolfram demonstration project предоставляет широкие возможности по моделированию экономических ситуации в виде теоретико-игровых моделей, учитывающих специфику взаимодеиствия нескольких экономических субъектов.
2. Технологии Wolfram, WolframAlpha, Wolfram demonstration project предоставляют широкие возможности по визуализации экономических данных, проблем и ситуации, что позволяет по-новому реализовать классическии принцип наглядности обучения [5].
3. Технология Wolfram demonstration project позволяет разрабатывать уникальные
OS
о.е
0.4
о: ---
I 02 0 4 06 08 Го
set of Nash equilibria
{{о, J}. {0,1}. {1. 0}}
у i 1.0
0.2 0.4 О.в 0.8 1.0
set of Nash equilibria
«1. О»
приложения под конкретные задачи математическои экономики, обеспечивая современныи уровень реализации информационных технологии в области экономики и финансов [2].
4. Технология Wolfram demonstration project успешно внедрена в учебньш процесс на факультете математическои экономики, статистики и информатики Россииского экономического университета им. Г.В.Плеханова, характеризуется высокими дидактическими характеристиками, позволяет реализовать интеграцию информационных и педагогических технологии [1] в методическои системе прикладнои математическои подготовки бакалавра экономики.
5. С методическои точки зрения целесообразное использование технологии Wolfram demonstration project способствует инструментальнои реализации системы педагогических технологии [8], что способствует повышению качества профессиональнои подготовки студентов бакалавриата и магистратуры.
6. С исследовательскои точки зрения реализация технологии Wolfram demonstration project восполняет дефицит инструментальных средств исследования современных экономических проблем и ситуации, открывает возможности количественного анализа и последующеи содержательнои интерпретации экономическои теории.
Литература
1. Власов Д. А. Интеграция информационных и педагогических технологий в системе прикладной математической подготовки будущего специалиста // Сибирский педагогический журнал. - 2009. - № 2. С. 109-117.
2. Власов Д. А. Информационные технологии в системе математической подготовки бакалавров: опыт МГГУ им. М.А. Шолохова // Информатика и образование. - 2012. - № 3. - С. 93-94.
3. Власов Д. А. Ретроспективный анализ развития методов и моделей теории игр // Инновационная наука. - 2016. -№ 8-1. - С. 42-43.
4. Власов Д. А., Монахов В. М., Монахов Н. В. Математические модели и методы внутримодельных исследований. - М.: МГГУ им. М.А.Шолохова. - 2007. - 345 с.
5. Власов Д. А., Синчуков А. В. Новые технологии WolframAlpha при изучении количественным методов студентами бакалавриата // Вестник Российского университета дружбы народов. - Серия: Информатизация образования. -2012.- № 4. - С. 43-53.
6. Власов Д. А. Особенности и математические основы современной экономической кибернетики // Техника. Технологии. Инженерия. - 2016. - №2. - С. 4-7.
7. Зельтен Рейнхард, Харшаньи Джон Общая теория выбора равновесия в играх. - М.: Экономическая школа, 2001. -424 с.
8. Монахов В. М. Введение в теорию педагогических технологий. - Волгоград: Перемена, 2006. - 318 с.
9. Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970. - 708 с.
10. Синчуков А. В., Пантина И. В. Вычислительная математика. - М.: Московский финансово-промышленный университет «Синергия». - 2012. - 176 с.
11. Тихомиров Н. П., Тихомирова Т. М. Риск-анализ в экономике. - М.: ЗАО «Издательство «Экономика», 2010. - 318 с.
References
1. Vlasov, D.A. Integration of information and pedagogical technologies in the application of mathematical preparation of the future expert // Siberian Pedagogical Journal. - 2009. - № 2. S. 109-117.
2. Vlasov, D.A. Information technology in the system of mathematical preparation of bachelors: MGGU experience them. MA Sholokhov // Computer science and education. - 2012. - № 3. - S. 93-94.
3. Vlasov, D.A. A retrospective analysis of the development of methods and models of game theory // Innovative science. -2016. - № 8-1. - S. 42-43.
4. Vlasov, D.A., VM Monakhov V.M., Monakhov N.V. Mathematical models and methods vnutrimodelnyh research. - M .: MGGU them. Sholokhov. - 2007. - 345 p.
5. Vlasov, D.A., Sinchukov A.V. WolframAlpha New technology in the study of quantitative methods for undergraduate students // Bulletin of Russian Peoples Friendship University. - Series: Informatization of Education. - 2012.- № 4. - S. 43-53.
6. Vlasov D.A. Features and mathematical foundations of modern economic cybernetics // Technique. Technologies. Engineering. - 2016. - №2. - P. 4-7.
7. Reinhard Selten, Harsanyi, John The general theory of equilibrium selection in games. - M.: The School of Economics, 2001. - 424 p.
8. Monakhov V.M. Introduction to the theory of educational technology. - Volgograd: Change, 2006. - 318 p.
9. J. von Neumann. Background, O. Morgenstern Theory of Games and Economic Behavior. M.: Nauka, 1970 - 708 p.
10. Sinchukov A.V., Pantina I.V. Computational Mathematics. - M.: Moscow Financial-Industrial University "Synergy". - 2012. -176 p.
11. Tikhomirov N.P., Tikhomirov T.M. Risk analysis in economics. - M.: JSC "" Economy "Publishing House, 2010. - 318 p.
Поступила 14.10.2016
Об авторах:
Власов Дмитрий Анатольевич, доцент кафедры математических методов в экономике Россииского экономического университета им. Г.В. Плеханова, кандидат педагогических наук, DAV495@gmail.com;
Синчуков Александр Валерьевич, доцент кафедры высшеи математики Россииского экономического университета им. Г.В. Плеханова, кандидат педагогических наук, AVSinchukov@gmail.com.