Об оптимальных по рискам и сожалениям ситуациях в игре двух лиц

Солдатова Наталья Геннадьевна

УДК 519.8

ОБ ОПТИМАЛЬНЫХ ПО РИСКАМ И СОЖАЛЕНИЯМ СИТУАЦИЯХ В ИГРЕ ДВУХ ЛИЦ

Н.Г. Солдатова1

Рассматривается бескоалиционная игра двух лиц. Качество функционирования игроков оценивается четырехкомпонентным векторным критерием, где учитываются исход (выигрыш), риск и сожаления игроков. Рассмотрены понятия оптимальных ситуаций бескоалиционной игры «с точки зрения» таких векторных оценок. Приведен пример. На основе принципа гарантированного результата и функции сожаления, введенной Сэвиджем, формализовано решение рассматриваемой игры. Установлено существование данного решения.

Ключевые слова: стратегия, равновесие по Нэшу, максимин, сожаление по Сэвиджу, риск по Вальду.

Введение. Рассмотрим математическую модель конфликта, которая представляет собой бескоалиционную игру двух лиц с дополнительным учетом рисков и сожалений [1, 2]:

({Xi }*б{1,2} ,{fi (X1, x2 ), р ( X1, X2 ), RV ( Xi), RS ( Xi )}/6{1,2> ) • (1)

В (1) предполагаем, что каждый i-ый игрок выбирает «свою» стратегию xi е Xi с compRnj; в результате возникает ситуация x = (x1, x2) е X1 X X2 ; скалярные функции f (x1, x2) (i е {1,2}) выигрыша игроков предполагаются непрерывными на произведении компактов X1 X X2 •

Ситуационное сожаление по Сэвиджу для i-го игрока определим как

р(x) = max f(xbx2)- f (X1,x2) (iе {1,2}).

xi eXi

Стратегический риск no Вальду i-го игрока положим

RV (xt) = max min f (xx, x2) - min f (xx, x2) (i, k е{1,2}, i ф к ).

xieXi xkeXk xkeXk

Стратегическое сожаление no Сэвиджу

R‘S(xi) = max pi(xx,x2) - min max pi(xx,x2) (i,ке {1,2},i ф к )•

xkеХк xiе-Xi xkеХк

Отметим, что риск по Вальду RV (xt) и сожаление по Сэвиджу R'S (xi) для каждого из игроков (i е {1,2}) определены как стратегические, то есть являются скалярными функциями только от выбранной стратегии xi е Xi. Вследствие непрерывности функций f (x1, x2) и компактности множеств Xi все указанные максимумы и минимумы существуют, причем функции ^(xj, x2), RV (xt), R‘S (xi) (i е {1,2} ) будут непрерывными.

В игре (1) игрок i оценивает ситуацию (xb x2) векторным критерием

(ft (x1, X2), Рг (X1, X2), RV (xi), RS (xi ) ) , (2)

причем значение первой компоненты f(xb x2) он стремится (за счет выбора xi е X) максимизировать, а значения остальных компонент желает получить возможно меньшими.

1. Оптимальные стратегии с учетом рисков и сожалений. Исследуем: каковы значения компонент векторных оценок (2) при условии оптимальности стратегий игроков?

Общепринятым понятием оптимальности в бескоалиционной игре является концепция равновесия (по Нэшу). Именно, пусть бескоалиционная игра двух лиц в нормальной форме описывается упорядоченным набором:

({Xi }/'е{1,2}, {fi(X1, X2) }/'е{1,2^ , (3)

где каждый i-й игрок оценивает ситуацию (x1, x2) данной игры значением «своей» скалярной функции выигрыша f ■ (x1, x2).

1 Солдатова Наталья Геннадьевна - старший преподаватель, кафедра математики и физики, Московский государственный областной гуманитарный институт. E-mail: [email protected]

Утверждение 1. Если в бескоалиционной игре двух лиц (3) ситуация (xf, xe2) является равновесной (по Нэшу), то есть

| fx{x{, 4) > f^, 4) Vxj е Xx,

1 f2( x1 , x2 ) > f2( x1 , x2) Vx2 е X2, то ситуационные сожаления по Сэвиджу в ситуации равновесия (xf, x2) равны нулю. Верно и

обратное, если р (x*, x*) = 0 (i е {1,2}), то ситуация (x*, x*) будет равновесной по Нэшу.

Данное утверждение сразу следует из определений равновесия по Нэшу и ситуационных сожалений по Сэвиджу.

Утверждение 2. Пусть в бескоалиционной игре двух лиц (3) стратегия первого игрока x* является максиминной, то есть max min f1(x1, x2) = min f1(x*, x2).

x2^.X2 x2eX2

Тогда стратегический риск первого игрока R^(x\) = 0 .

Аналогично, если стратегия второго игрока x* является максиминной, именно

max min f (x1, x2) = min f2 (x1, x*),

x2eX2 x!^.X1 x!^.X1

то стратегический риск второго игрока Rj2 (x2) = 0 .

Также из равенства нулю стратегического риска игрока следует, что его соответствующая стратегия будет максиминной.

Утверждение 3. Предположим, что в антагонистической игре ^{Xi}ie{12}, f (x1, x2)^ функция выигрыша первого игрока f1(x1, x2) = f (x1, x2), функция выигрыша второго игрока

f2 (x1, x2) = -f (x1, x2) и ситуация (x1e, x2) является равновесной (седловой точкой). Тогда

1) ситуационные сожаления по Сэвиджу в ситуации равновесия равны нулю, то есть P(xf,x2) = 0 (iе {1,2});

2) стратегические риски по Вальду для равновесных стратегий равны нулю, то есть RJ (xf) = 0 (i е {1,2} );

3) если (xfe1, x21) и (xf2, x22) - две равновесные ситуации (седловые точки), то они эквивалентны для обоих игроков «с точки зрения» значений функций выигрыша, то есть f ( xf 1, x21) = f ( xe2, x2e2).

Таким образом, для любых равновесных ситуаций (седловых точек) (xf, x2) антагонистической игры первые три компоненты векторных оценок (f (4, x2),p ((, x2), RJ (xf), RS (xf)) (i е{1,2}) ситуаций (xf, x2) игры для обоих игроков совпадают (с учетом равенства

f (xf, x2)=f xf, x2)).

Проиллюстрируем «важность» четвертой компоненты векторной оценки ситуаций равновесия антагонистической игры на примере матричной игры.

Рассмотрим конечную (матричную) игру

Г ' ^ ' '' (4)

с действительной m X n - матрицей

(

A--

Vml x1 J (N * N 2 4 xn} 2

a11 «12 - a > U1n

«21 ... « ... a n

am1 m 2 a j mn J

где стратегия х[ е Хх первого игрока означает выбор /-ой строки матрицы А, стратегия х2 е Х2 второго игрока есть выбор 7’-ого столбца этой же матрицы, значения функций выигрыша игроков

2013, том 5, № 2 61

Математика

для

в ситуации (x[, x2) определяются элементом ay матрицы A = (aiy-), именно,

f (x1, x{) = f (x, x2) = ay, f2 (x, x2) = -f (x1, x2) = -ay . (5)

Формализуем матричную игру с учетом рисков и сожалений

Га = ({Хк}И1,2}, A = (ay ),{фk = (рр )} 2} ,{4(xj)R*(x{),R\(xj),R2S(x')}),

где X1 ={x1,...,xm} - множество стратегий первого игрока, X2 ={x2,...,xrn} - совокупность стратегий второго игрока, значения функций выигрыша игроков в ситуации (x1, x2) определены выше.

Определим матрицы ситуационных сожалений игроков и их риски при выборе соответствующих стратегий. Матрица Ф1 =(у) ситуационных сожалений по Сэвиджу для первого игрока вычисляется следующим образом:

P1 = P (x, x2) = max f (x1, x2) - f (x^, x{) = max ay - a■,

4eX1 ie{1,...,m}

второго игрока компоненты матрицы Ф2 = (2) ситуационных сожалений по Сэвиджу есть

pf] = р2 (x1, x2 ) = m ax f2 (x1, x2 ) - f2 (x1, x2 ) = ay - min , ay .

x2 eX2 ye{1,...,n}

Стратегический риск по Вальду для первого игрока при выборе стратегии x1i равен Ry (x1) = max min f1 (x1, x^) - min f (x[, x^) = max min ay - min ay ,

x1IeX1 x{ eX 2 x2'eX2 ie{1,...,m}ye{1,...,n} ye{1,...,n}

для второго игрока при реализации стратегии x2 стратегический риск по Вальду

RJ (x{) = max min f2 (x[, x2) - min f2 (x1i, x2) = max ay - min max cty .

xj eX 2 x'eX1 x1i eX1 ie{1,...,m} ye{1,...,n}ie{1,...,m}

Стратегическое сожаление по Сэвиджу для первого игрока при выборе стратегии x1i равно Rs (x1) = max р (x, x2) - min max p (x1i, x2) = max р1 - min max (p),,

x2 eX 2 x1IeX1 x2 eX2 ye{1,...,n} ie{1,..., m} je[1,...,n}

для второго игрока при реализации стратегии x2 стратегическое сожаление по Сэвиджу Rs (x2) = max р2 (x1, x^) - min max p2 (x1i, x^) = max pi, - min max (py .

x1Ie.X1 x{eX2 x1ieX1 ie{1,...,m} ye{1,...,n}ie{1,...,m}

Приведем определение седловой точки матричной игры (4). Пусть задана матричная игра (4), где значения функции выигрыша первого игрока в ситуации (x1,x2) определены в (5).

Ситуация (x1 , x2 )е X1 X X2 является равновесной (седловой точкой игры), если

f (x1, x2) < f (x1, x2) < f (x , x2) для всех стратегий x1k e X1 первого игрока и любой стратегии x2 е X2 второго игрока.

В матричной форме последнее условие имеет вид a * < a л * < a ^ для всех

kе{1,...,m}, tе{1,...,n} .

Пример. Рассмотрим антагонистическую (матричную) игру, в которой у каждого игрока по четыре чистых стратегии. Игра задана матрицей:

(7 -1 -4 1 ^

A =

4 2 3 2

2 2 5 2

4 -3 7 -2

О О О Л О Ъ А.

В данной игре четыре равновесия (х х, х 2),(х х, х2),(х х, х2),(х х, х2), причем в каждой равновесной ситуации выигрыш первого игрока (проигрыш второго) равен двум единицам. Вычислим стратегические сожаления игроков для равновесных стратегий:

^ (х1 X ^ (х1 X ^ (х2 ), (х2 ) •

Компоненты матрицы Ф^ = (р-) сожалений (ситуационных) первого игрока вычисляется по формуле:

Py = max ay - a

Получаем

Ф1s =

( 0 3 5 3

11

4

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2

0

iy

1 ^

0

4

Элементы матрицы Ф^ =(<Ру ) сожалений второго игрока определяются равенствами:

р2 = тах(- а 1}) - (-а1}) = а1} — тт а1}, у у

здесь учитываем тот факт, что /2 (х1, х2) = —а у . Поэтому

iy

(11

2

0

7

0 10 1

Согласно принципу минимаксного сожаления получаем:

12 min max py = 4, min max py = 3 .

у y y i

Используя равенства

Rl (x1) = max py - min max py и RS (x2) = max p2 - min max p2,

jij i y i

находим стратегические сожаления:

rS(x2) = 0, RS(x3) = 1, Rj(x2) = 0, Rs2(x24) = 2 .

Следовательно, существует единственное равновесие (x12,x2,) в данной игре, для которого все риски и сожаления каждого игрока нулевые.

2. S-оптимальные по рискам и сожалениям равновесные стратегии

Исходной игре (1) поставим в соответствие две двухкритериальные задачи:

Г =( Xf,{-R1( x1), - R1( х)}), где Xf - множество равновесных стратегий первого игрока,

Г2 = ( X 2,{-R2( x2), - Rs2( x2)} где X2 - множество равновесных стратегий второго игрока.

Определение 1. Равновесные стратегии xf е Xf первого и x2 е X2 второго игроков в игре (1) назовем s-оптимальными по рискам и сожалениям, если они являются максимальными по Слейтеру для задач Г1 и Г2 соответственно.

Теорема 1. Пусть в игре (1) выполнено:

1) множества X1 и X2 выпуклы и компактны;

2) функция f1(x1, x2) непрерывна на X1 X X2 и вогнута по x1 при любых фиксированных значениях x2 е X2;

2013, том 5, № 2

63

Математика

3) функция f2(x1, x2) непрерывна на X1 XX2 и вогнута no x2 для каждого x1 е X1.

Тогда в (1) существуют s-оптимальные равновесные стратегии для каждого игрока.

Данное утверждение следует из достаточных условий существования равновесных ситуаций в бескоалиционной игре двух лиц, компактности множества равновесий по Нэшу и свойств максимальных по Слейтеру решений для многокритериальных задач.

Теорема 2. Пусть xf е Xf , x2 е Xe2 есть s-оптимальные по рискам и сожалениям равновесные стратегии игроков.

Тогда xf является максиминным по Слейтеру решением [3] четырехкритериальной задачи

Г1 = ^X1 , X2 , {f1 (x1, x2 ), -p1 (x1, x2 ), -RV (x1), -RS (x1^ .

Соответственно x2 будет также максиминным по Слейтеру решением для задачи

Г2 = ( X1 , X2 , {f2 ( x1, x2),-p2( x1, x2),- RV( x2),- RS ( x2)) .

Заключение. Рассмотренные утверждения и пример показывают: добавление рисков и сожалений игроков к их функциям выигрышей позволяет в ряде случаев выделить в игре единственное равновесие по Нэшу.

Литература

1. Бардин, А.Е. Риски и сожаления игроков в игровых моделях / А.Е. Бардин // Материалы 3-ей международной научно-практической конференции. МГОГИ. Орехово-Зуево. - 2010. - С. 8689.

2. Бардин, А.Е. Риски и сожаления ЛПР в игре с природой / А.Е. Бардин, Ю.Н. Житенева // Международный научный журнал «Спектральные и эволюционные задачи». Симферополь. -2012. - Т. 22. - С. 2-5.

3. Zhukovskiy, V.I. The Vector-Valued Maximin / V.I. Zhukovskiy, M.E. Salukvadze. - N.Y. etc.: Academic Press, 1994. - 282 p.

ABOUT OPTIMUM ON RISKS AND REGRETS SITUATIONS IN GAME OF TWO PERSONS

N.G. Soldatova1

Non-cooperative game of two persons is considered. Quality of functioning of players is estimated by four-component vector criterion. Here an outcome (payoff), risk and regrets of players are considered. Concepts of optimum situations of non-cooperative game from the point of view of the stated vector estimates are considered. The example is given. Solution of game is based on the principle of guaranteed result and function of regret used by Savage. Existence of this solution is established.

Keywords: strategy, Nash equilibrium, maximin, Savage regret, Wald risk.

References

1. Bardin A.E. Riski i sozhaleniya igrokov v igrovykh modelyakh. Materialy 3-ey mezhdunarodnoy nauchno-prakticheskoy konferentsii (Risks and regret players in the game models. Proceedings of the 3rd International Scientific Conference). MGOGI. Orekhovo-Zuevo, 2010. pp. 86-89. (in Russ.).

2. Бардин A.E., Житенева Ю.Н. Mezhdunarodnyy nauchnyy zhurnal «Spektral'nye i evolyutsionnye zadachi». Simferopol'. 2012. Vol. 22. pp. 2-5. (in Russ.).

3. Zhukovskiy V.I., Salukvadze M.E. The Vector-Valued Maximin. N.Y. etc.: Academic Press. 1994.282 p.

Поступила в редакцию 1 августа 2013 г.

1 Soldatova Natalya Gennadevna is Senior Lecturer, Department of Mathematics and Physics, Moscow State Regional Institute of Humanities. E-mail: [email protected]

Об оптимальных по рискам и сожалениям ситуациях в игре двух лиц Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Солдатова Наталья Геннадьевна

Похожие темы научных работ по математике , автор научной работы — Солдатова Наталья Геннадьевна

About optimum on risks and regrets situations in game of two persons

Текст научной работы на тему «Об оптимальных по рискам и сожалениям ситуациях в игре двух лиц»