УДК 519.8
СИЛЬНО ГАРАНТИРОВАННОЕ РАВНОВЕСИЕ В ОДНОЙ ИЕРАРХИЧЕСКОЙ ДВУХУРОВНЕВОЙ ИГРЕ ПРИ НЕОПРЕДЕЛЕННОСТИ
А.Е. Бардинл, Н.Г. Солдатова2
Рассмотрен новый подход к принятию решений для двухуровневой статической иерархической системы в условиях действия неопределенных факторов. Формализация оптимального решения базируется на понятиях равновесия по Нэшу, ситуационного сожаления по Сэвиджу и векторной гарантии.
Ключевые слова: иерархическая игра, равновесие по Нэшу, принцип минимаксного сожаления Сэвиджа, векторная гарантия, неопределенность.
Постановка задачи
Рассматривается модель конфликта в виде двухуровневой иерархической игры трех лиц при неопределенности
Г = ({С,1,2},{и,X }=1,2,Уихх(и,х,у)}г=сд,2),
где С - игрок верхнего уровня иерархии (Центр), числа 1, 2 - порядковые номера игроков нижнего уровня. Управляющее воздействие Центра есть и е и, стратегия 7-го игрока нижнего уровня есть х7 е Х7, 7 е {1,2} . Игроки нижнего уровня независимо друг от друга выбирают свои стратегии, в результате реализуется ситуация игры (на нижнем уровне) х = (х1, х2) е X = Х1 х Х2 . В игре Г каждый из трех игроков стремится достичь больших значений своей функции выигрыша (и, х,у), ] е {С,1,2} . При этом он должен учитывать возможность реализации любой неопределенности у е У.
Далее наряду с «чистыми» неопределенностями у еУ будем использовать «информированные неопределенности» вида
у(-): и х X ® У
или (в частном случае)
у( ): X ® У ,
введенные академиком Н.Н. Красовским при исследовании антагонистической минимаксной позиционной дифференциальной игры [1, с. 353-354].
Перейдем к иерархической «процедуре» принятия решений в игре Г, которая заключается в определенном порядке ходов.
Первый ход за обоими игроками нижнего уровня и Центром: они передают лицу, принимающему решения (ЛПР) и формирующему неопределенности, свои стратегии х7 е Xi (7 = 1,2), иеи (рис. 1).
Второй ход за ЛПР, аналитически конструирующем «ин-
Рис. 1
1 Бардин Александр Евгеньевич - кандидат физико-математических наук, доцент, кафедра информатики, Московский государственный областной гуманитарный институт.
E-mail: intch2006@rambler.ru
2 Солдатова Наталья Геннадьевна - старший преподаватель, кафедра математики и физики, Московский государственный областной гуманитарный институт.
E-mail: solnata@pochta.ru
формированную» неопределенность, именно он определяет функцию
y(-): U X X ® Y
согласно
min fc (u, x, y) = fc (u, x, y(u, x)) = fc [u, x] "u eU, х e Х (1)
yeY
и передает эту функцию y(u, x) Центру (рис. 2). Здесь используем подход из работ [2-4]. Далее будем предполагать, что указанная выше функция y(u, x): U X X ® Y существует и единственна.
Центр
1 игрок 2 игрок
y(u,x)
Неопределенность
Рис. 2
Отметим, что согласно (1) для любой неопределенности y е Y имеет место неравенство
fc (u,x, у) ^ fc [u, x] (2)
при всех (u,x): UXX .
Третий ход за Центром: он формирует стратегию
u(-): X ® U, u(-) е UХ ,
такую, что
max fc (u, x, y(u, x)) = max fc [u, x] = fc [u(x), x] = fc [x] Vx е Х (3)
ueU ueU
и передает эту стратегию u() обоим игрокам нижнего уровня иерархии (рис. 3). Здесь также
предполагаем существование и единственность функции у(x): X ® Y .
Рис. 3
Четвертый ход за игроками нижнего уровня иерархии:
во-первых, 7-ый игрок (i = 1,2) строит свою вспомогательную функцию
f. [ x] = min fi (u (x), x, y) (i = 1,2);
yeY
(4)
во-вторых, по определенной в (4) функции [х] каждый игрок нижнего уровня находит так называемую функцию «сожаления» по Сэвиджу [5]
Fj [ x] = max f[ z, x2] - f [ xl5 x2],
zeX,
F2 [ x] = max f~2 [ xj, z] - _^j[ xj, x2],
(5)
zeX 2
значения которых каждому из игроков 7 = 1,2 желательно получить возможно меньшими;
в-третьих, для вспомогательной бескоалиционной «игры гарантий» (без неопределенности)
Бардин А.Е., Сильно гарантированное равновесие в одной иерархической
Солдатова Н.Г. двухуровневой игре при неопределенности
Г0 = ({1,2},{X }й{1,2},{j(X) = f[х]-Ф,[х]}ге{1,2}
игроки нижнего уровня находят ситуацию равновесия по Нэшу [6], которая определяется равенствами
max j (х1, х2) = j (х1, х2),
Xl£Xl (6)
max j2 (х1, х2) = j2( х1, х2).
Х2^.Х 2
При этом снова будем предполагать, что ситуация равновесия по Нэшу в игре Гс единственна.
Отметим, что равновесная стратегия е Х1 из (6) является максимальной по Парето в двухкритериальной задаче
(Xi,{/i[*i, х2 ], -Ф1[х1, х2 ]}), (7)
тогда увеличение исхода f1 [х1, х2 ] влечет увеличение «сожаления» Ф1 [х1, х2 ], а уменьшение «сожаления» Ф1[ xl, х2] приводит к уменьшению исхода f1 [х1, х2 ]. При этом значение функции
Ф1[ х1 , х2 ] в ситуации равновесия (х^, х2) равно нулю, что является оптимальным (наименьшим)
значением этой функции на множестве X = X1 X X2.
Аналогичное свойство выполняется для стратегии хе2 е Х2 из равновесной ситуации (х\, х2) в двухкритериальной задаче
X 2,{ U х?, х2], -Ф 2К , х2]^ . (8)
Раскроем «гарантированный смысл» указанного в (6) равновесия хе = (х?е, х2) в исходной игре Г, именно:
с одной стороны, при известной игрокам i е {1,2} функции и(х?, х2) и любой неопределенности у е Y выполняется неравенство
f (и(хе),хе,у) > f.[хе]; (9)
с другой, для «замороженной» Центром и(х) и определенной равенством (1) функции у(и,х) будет
Л(и(х1, х2), х1, х2,у(и(х1, х2), хь х2)) < Л[хе ], (10)
f2 (и(х1, х2 ), х1, х2, у(и(х1, х2 ), х{ , х2)) < fj[хе ], (11)
для всех х1 е Х1 и х2 е Х2.
Еще раз отметим, что
minФ,[х] = Ф,[хе] = 0, iе {1,2}, (12)
хеХ
а нулевые и достигаемые в ситуации равновесия хе значения функций сожаления являются наилучшими для каждого игрока i = 1,2.
в-четвертых, игроки нижнего уровня «отправляют» Центру найденную равновесную (единственную) ситуацию хе е Х (рис. 4).
Рис. 4
Последний пятый ход состоит в нахождении Центром своей гарантии
I [хе ] = Гс (и( Xе), хе, у(и(хе), хе)), (13)
для нее выполнено неравенство
/с (и(Xе),Xе ,у) > / [Xе]
при любой неопределенности у е У .
Определение 1. Сильно гарантированным равновесием в иерархической игре при неопределенности Г (с одним игроком верхнего уровня и двумя игроками нижнего уровня) называется набор
где Xе = (х[, х2) - ситуация равновесия по Нэшу в игре гарантий Гс , и( ): X ® и есть функция, передаваемая Центром игрокам нижнего уровня, величины
При этом предполагается,
во-первых, игроки верхнего и нижнего уровней, а также ЛПР, «отвечающий» за построение «информированной» неопределенности у( ), придерживаются процедуры принятия решений, описанной выше (см. ходы 1-5);
во-вторых, обе функции у( ) из равенства (1) и у( ), определенная условием (3), а также равновесие по Нэшу в игре Гс единственны.
Очевидно следующее утверждение.
Лемма 1. Ситуация хе = (х^, х2) будет равновесной в игре Гс тогда и только тогда, когда хе есть равновесие по Нэшу в игре
где функции выигрыша игроков заданы равенствами (4).
Линейно-квадратичная игра без ограничений (скалярный случай)
Пусть в игре Г множества и = Х1 = Х2 = У = Я . Скалярные функции выигрыша игроков определены ниже:
(хе, и(-), //, $, Я),
(14)
/! = /с [и(хе), хе ], /* = /1[хе ], // = /2[хе ].
(15)
2
2
2
/ (и, х, у) = )и 2 + б« х2 + Ь3(3} х22 + У2 + 2Ь1(2)их1 + 2Ь1(3)их2 + 2Ь1(4)иу + (16)
+2^х1 х2 + 2Ь^4>х1 у + 2Ь3(4)х2у + 2Ь1(0)х1 + 2Ь20х2, ■ е {1,2}.
Из условий
(17)
получаем, что
шп /с (и, х, у) = /с (и, х, у (и, х))
уеУ
достигается при
( 2 У(u, х) = -«Зз1 а13и + Е °23) х1
V ■=1 У
Окончательно имеем
а33а11 а13
Из условий
Сильно гарантированное равновесие в одной иерархической двухуровневой игре при неопределенности
&.
ды
= 2a
33
2
( a11a33 - ai23)ы + Z (а1(2}a33 - a13a23) ) x i=1
= 0,
(18)
a11a33 a13 < 0
получаем функцию ы( ): X ® U, именно
-1 ( 2
(x) = (a123 - a11a33 ) Z(a1(2)a33 - a13a23))
V i=1
которую далее пишем в виде
и(х) = с1 х1 + с2х2 .
С учетом последнего равенства получаем функции
■) + и(0 +1 А('-Ь Ь2 + („ЫО + и(О
ft [^ У] = f(u(xX У) + b22 + 261(2)c1 ) x12 +( Фи + b3(3) + 2b1(3)c2 ) x2 + 2 ( C1C2bU + c2b1(2
(19) ) +
+c1b1(3) + b23)) х1х2 + b44 у2 + 2 (b1(4)c1 + b24)) x1 у + 2 (b1(4)c2 + b3(4)) x2 у + 2b1(0)x1 + 2b20) x2, которые ниже пишем в виде
fi (x, у) = J1(J)X]2 + d22)x2 + 2d1(2)x1x2 + d3(3) у2 + 2d1(3)x1 у + 2d23)x2у + 2d1(0)x1 + 2d20)x2 . (20)
Из условий
df[ x y] = 2d3(3) у + 2d1(3) x1 + 2d23) x2 = 0,
ду
d33 > 0, te {1,2}
имеем явный вид функций гарантированных исходов для игроков нижнего уровня
f [ x] = min f [ x, у] = f [ x, у i(x)],
уеГ
(21)
(22)
где
у t (x) = h(0x1 + h>0x2, h° = -(d3(3)) 1 d1(3), h() = -(d3(3)) 1 d23), t e {1,2} .
Таким образом
/ [ х] = ( ^^ (и( г) )2+2^1(3) и( г) ^ х?+^ 42 + 43 (и2г) )2+2^3 У х22+2 (43 и(0 и2г)+42+43) ¿2°+
+43)И(г)) х1х2 + 2а?1(0) х1 + 2а?2о х2, ге{1,2).
Введя новые обозначения, получаем
/[ х] = кЦ х12 + к22 х^ + 2к1(2) х1х2 + 2к1(0) х + 2^20) х2.
Используя достаточные условия существования равновесия по Нэшу в игре
Г = <{1,2>,{Х, } ,е{,.2),{.Г,[х]} ,е{,.2^ ,
решаем систему
(23)
f = 2&Ц x1 + 2к$ x2 + 2k1(J) = 0, dx1
^ = 2kg x2 + 2k1(22) x1 + 2k22) = 0 dx2
(24)
k1(1) < 0, k22) < 0.
Равновесная ситуация xe в игре Г представима в виде xe = (x1e, x2), где
xl = D-1 D1, x2 = D-1 D2 и
D = k(i)k(2) - ka)k(2) Ф 0 D = k(Dk(2) - k(i)k(2) D = k(i)k(2) - k(i)k(2)
11 22 12 12 1 10 22 12 20 2 11 20 10 12
(25)
ы
Как было отмечено выше, равновесная ситуация хе в игре Г совпадает с равновесной ситуацией в игре Гс . Суммируя полученные результаты, получаем следующее утверждение.
Теорема. Пусть в игре Г заданы множества
и = Х1 = X 2 = У = Я .
Скалярные функции выигрыша игроков определены равенствами (16) и выполнены неравенства
а33 > 0, а11а33 — а13 < 0 , ^33 > 0, кР < о, ■е {1,2),
а также
А=кй) к22)—к£ к1(22) * 0, где величины ^3(3), к,]*, ,е {1,2} определены условиями (19)-(24).
Тогда в игре Г существует равновесно-сильно-гарантированное решение, явный вид которого представлен в (25).
Указанная в теореме система условий будет совместной, если, например, а11 = а33 = а1(2) = 1,
а,3 а23>=0, = *44’=1, *22’ = *33’ =—>, *1(2’ = ¿>¡3’ =-2. *1(4’ = *24 = ¿34' = *23’=2.
Заключение
В работе рассмотрен один из подходов к проблеме формализации риска в игровых моделях иерархических структур, который основан на принципе минимаксного сожаления по Сэвиджу. Для иерархической игры в условиях действия неконтролируемых факторов (неопределенностей) можно предложить другие способы моделирования риска игроков верхнего и нижнего уровней, используя модификации различных принципов принятия оптимальных решений из теории задач при неопределенности [2-4].
Литература
1. Красовский, Н.Н. Позиционные дифференциальные игры / Н.Н. Красовский, А.И. Субботин. - М.: Наука, 1974. - 456 с.
2. Жуковский, В.И. Риски при конфликтных ситуациях / В.И. Жуковский. - М.: URSS, ЛЕНАНД, 2011. - 328 с.
3. Жуковский, В.И. Уравновешивание конфликтов и приложения / В.И. Жуковский, К.Н. Кудрявцев. - М.: URSS, ЛЕНАНД, 2012. - 304 с.
4. Жуковский, В.И. Уравновешивание конфликтов при неопределенности. II. Аналог макси-мина / В.И. Жуковский, К.Н. Кудрявцев // Математическая теория игр и ее приложения. - 2013. -Т. 5, № 2. - С. 3-45.
5. Savage, L.Y. The theory of statistical decision / L.Y. Savage // J. American Statistic Association. - 1951. - № 46. - Р. 55-67.
6. Nash, J.F. Non-cooperative games / J.F. Nash // Ann. Math. - 1951. - Vol. 54. - P. 289-295.
Поступила в редакцию 5 ноября 2013 г.
Сильно гарантированное равновесие в одной иерархической двухуровневой игре при неопределенности
Bulletin of the South Ural State University Series “Mathematics. Mechanics. Physics” ________________2014, vol. 6, no. 1, pp. 15-21
STRONGLY GUARANTEED EQUILIBRIUM IN ONE HIERARCHICAL TWO-LEVEL GAME UNDER UNCERTAINTY
A.E. Bardin1, N.G. Soldatova2
In the article new approach to decision-making for two-level static hierarchical system under uncertain factors is considered. Formalization of the optimum solution is based on the concepts of Nash equilibrium, situational Savage regret and a vector guarantee.
Keywords: hierarchical game, Nash equilibrium, principle of Savage minimax regret, vector guarantee, uncertainty.
References
1. Krasovskiy N.N., Subbotin A.I. Pozitsionnye differentsial'nye igry (Positional differential games). Moscow, Nauka Publ., 1974. 456 p. (in Russ.).
2. Zhukovskiy V.I. Risk pri konfliktnykh situatsiyakh (Risks at conflicts). Moscow, URSS, LENAND Publ., 2011. 328 p.
3. Zhukovskiy V.I., Kudryavtsev K.N. Uravnoveshivanie konfliktov i prilozheniya (Equilibration of conflicts and application). Moscow, URSS, LENAND Publ., 2012. 304 p. (in Russ.).
4. Zhukovskiy V.I., Kudryavtsev K.N. Matematicheskaya teoriya igr i ee prilozheniya. 2013. Vol. 5. no. 2. pp. 3-45. (in Russ.).
5. Savage L.Y. The theory of statistical decision. J. American Statistic Association. 1951. no. 46. pp.55-67.
6. Nash J.F. Non-cooperative games. Ann. Math. 1951. Vol. 54. pp. 289-295.
Received 5 November 2013
1 Bardin Aleksandr Evgenievich is Cand. Sc. (Physics and Mathematics), Associate Professor, Department of Informatics, Moscow State Regional Institute of Humanities.
E-mail: intch2006@rambler.ru
2 Soldatova Natalya Gennadevna is Senior Lecturer, Department of Mathematics and Physics, Moscow State Regional Institute of Humanities. E-mail: solnata@pochta.ru