УДК 519.7
М. С. Никольский1
ПРИБЛИЖЕННОЕ ВЫЧИСЛЕНИЕ ТОЧЕК РАВНОВЕСИЯ ПО НЭШУ ДЛЯ ИГР ДВУХ ИГРОКОВ*
Для общей игры двух игроков развивается приближенный метод вычисления точек равновесия по Нэшу.
Ключевые слова: игра двух игроков, точки равновесия по Нэшу, приближенное вычисление.
Рассматривается игра двух игроков (см., например, [1-6]), которая описывается следующим образом. В йр, р ^ 1, ий'.О 1, фиксированы два непустых компакта X, У соответственно. Первый игрок выбирает точку ж из X, второй игрок выбирает точку у из У. Символом 11к, где к ^ 1, условимся обозначать ^-мерное евклидово действительное арифметическое пространство, элементами которого являются упорядоченные наборы из к действительных чисел, записываемых в виде столбцов, со стандартным скалярным произведением (ж', ж") векторов ж', ж" из Б,к и длиной |ж| векторов х € Як■
Обозначим г = (ж, у), где ж € у € Я4. В пространстве таких пар вводятся естественным образом операции сложения и умножения на числа, а также скалярное произведение вида
{г', г") = (ж', ж") + {у', у"),
где z' = (ж', у'), z" = (ж", у"). Длина вектора z = (ж, у) определяется по формуле \z\ = у |ж|2 + |у|2. Таким образом, пространство пар z = (ж, у) наделено структурой линейного евклидова пространства. Обозначим его 94. Множество пар z = (ж, у), где ж G X, у G F, обозначим Z. Очевидно, Z — компакт в т.
На Z заданы непрерывные скалярные функции /(ж, у), д(ж, у), причем /(ж, у) — функция выигрыша 1-го игрока, а д(х,у) — функция выигрыша 2-го игрока. Первый игрок за счет выбора вектора стремится к максимизации выигрыша /(ж, у). Второй игрок стремится за счет выбора вектора у € Y к максимизации выигрыша д(ж, у). Нас будет интересовать вопрос о приближенном вычислении точек равновесия по Нэшу в рассматриваемой игре.
Определение. Точка zq = (жо,уо) € Z называется точкой равновесия по Нэшу в рассматриваемой игре, если для нее выполняются условия
Дж,Уо) < Джо,уо) Viel, (1)
д(%а,у) < д(%а,Уа) Vy G Y. (2)
Множество точек равновесия по Нэшу в изучаемой игре обозначим 2t. Отметим, что далеко не всегда 2t — непустое множество. Настоящая работа посвящена приближенному вычислению точек множества 2t в предположении, что 2t ф 0.
Отметим два важных случая, в которых множество 2t ф 0.
1. Если множества X,Y — выпуклые компакты, функция /(ж, у) вогнута по ж € X при любом фиксированном у € Y, а функция д(ж, у) вогнута по у € Y при любом фиксированном ж € X, то 2t ф 0.
Замечание. Этот факт широко известен в теории игр (см., например, [1-5]).
2. Если множества X,Y — выпуклые компакты и множества максимизаторов
Si (у) = Arg max/(ж, у), s2{x) = Arg тах^(ж, у)
х£Х y£Y
одноточечны соответственно при всех у € Y и при всех ж G X, то 21 ф 0.
Замечание. Этот факт известен (см., например, [5]).
1 Факультет ВМК МГУ, проф., д.ф.-м.н., e-mail: mniQmi.ras.ru
* Работа выполнена при финансовой поддержке РФФИ, проекты № 12-01-00175-а, 12-01-00506, 13-01-00685, 13-0112446 офи-м2.
Рассмотрим при z G Z функцию (потенциал игры)
h(z) = (ш/fey) -/(®,у)) + (maxg(x,r¡) - д(х,у)^, (3)
где z = (ж, у). Отметим, что функция типа (3) для игр N лиц уже рассматривалась ранее в литературе (см., например, [6]). Рассмотрим далее величину
v = mmh(z). (4)
Отметим, что функция
/о (у) = тах/(£,у) (5)
непрерывна на Y, а функция
д0(х) = тах g(x,r¡) (6)
непрерывна на X (см., например, [7]). Поэтому функция h(z) (см. (3)) непрерывна на Z и величина v (см. (4)) определена корректно. Нетрудно видеть, что (см. (3), (4))
h(z) ^ 0 Vz € Z и г/^0. (7)
Величина v (см. (4)) играет важную роль, например, при исследовании вопроса о непустоте множества 21. Это вытекает из следующих далее лемм 1, 2.
Лемма 1. Пусть точка zq = (хо,уо) является точкой равновесия по Нэшу. Тогда
v = h(zQ) = 0. (8)
Таким образом, при непустоте 21 выполняется равенство v = 0.
Доказательство. Равенство (8) вытекает из соотношений (1)-(4), (7). Лемма 2. Пусть точка zq = (хо,уо) £ Z и выполнено условие (см. (3))
h(zo) = 0. (9)
Тогда и = 0 и точка zq G 21.
Доказательство. Из соотношений (7), (9) вытекает, что v = 0. Заметим далее, что при произвольном z G Z выполняются неравенства
max/(£,y) -f(x,y) ^ 0, таxg(x,r¡) - g(x,y) ^ 0.
Í&X íjGl
Отсюда и из (3) при произвольном z G Z получаем неравенства
тах/(С,у) - /(ж,у) < h(z), (10)
таxg(x,r¡) - g(x,y) < h(z). (И)
Отсюда и из равенства (9) вытекают неравенства
тах/(£,у0) < /(ж0,у0), таxg(x0,r¡) < 5(®0,у0),
íjGI
т.е. z0 G 21 (см. (1), (2)).
Из лемм 1, 2 вытекают следующие факты.
A. Если v = 0, то: 1) 21 ф 0 и все точки z G 21 удовлетворяют уравнению
¿,(z) = 0; (12)
2) из равенства (12) следует, что z G 21; 3) множество 21 является компактом.
B. Если v > 0, то 21 = 0 и уравнение (12) не имеет решений при z G Z. Отметим еще, что если точка zq = (хо,уо) G Z удовлетворяет соотношению (см. (3))
h(za) = Ц,
где /i ^ 0, то из (10), (11) вытекают неравенства
тах/(ж,у0) < f(x0,y0) + М, (13)
х£Х
таaig(xQ, у) < д(х0,у0) + ц. (14)
В соответствии с терминологией теории игр точку (хо,уо), удовлетворяющую неравенствам (13), (14) при некотором /х ^ 0, называют /¿-равновесием по Нэшу для изучаемой игры.
Фиксируем на X некоторую совокупность точек щ,...,ир, где целое число Р ^ 1, и на Y некоторую совокупность точек v\,...,vq, где целое число q ^ 1. Множества точек
U = {щ,...,иР}, V = {vi,... ,VQ} (15)
образуют сети на X, Y соответственно. Обозначим
a(U) = max min \х — щ\, (16)
v ' xexi^р1 г" v !
ßiV) = max min \y — vA. (17)
yEY l^j^Q
Величины a(U), ß(v) характеризуют плотность сетей U, V соответственно в X, Y. Отметим, что при произвольном е > 0 можно указать такие сети Ue, V£ (см. (15)), что будут выполняться неравенства
a(U£) < г, ß(V£) < е.
Рассмотрим еще сеть W на Z вида
w = {(ui,vj) : 1 < г < р, 1 < з < q} (18)
и величину
j(W) = max min \z - (tt»,Vj)|- (19)
z£Z 1 Ц.1Ц.Р
i sy^Q
Фиксируем z = (ж, у) G Z и номера г € {1,..., Р}, j G {1, • • •, Q}. Тогда
\z - (ui,Vj)I < \x - щ\ + \y - Vj|. (20)
Из (18)-(20) вытекает неравенство
j(W) < a(U)+ß(V). (21)
Для приближенного вычисления точек множества 21 в случае его непустоты предлагается рассмотреть матрицу (hij), где (см. (3))
hij = h(zij), Zij = (Ui,vj), 1 < i < P, l^j^Q. (22)
Обозначим
vtjy = min ha. (23)
l J
i iiiQ
Из формул (4), (7), (23) и леммы 1 вытекает неравенство
vjjv ^ I/ = 0. (24)
Мы хотим показать, что для произвольного фиксированного е > 0 можно подобрать такую величину 8{е) > 0, что (см. (16), (17)) при
a(U)^6(e), ß (V)^S(e) будет выполняться (см. (4), (22), (23)) неравенство
\v — vuv\ ^ е- (25)
В силу неравенства (24) для этого достаточно будет обосновать неравенство
VUV < £ (26)
при достаточно малых величинах a(U), ß(V).
В дальнейшем нам понадобится понятие модуля непрерывности функции.
Определение. Пусть скалярная функция определена на непустом множестве е с rk, где к ^ 1. При S ^ 0 рассмотрим величину
ш(<р,8) = sup{|9?(Ci) - <р(£2)| : Сьб G Е и - £2| С 5}-
Функция ш(<р,6) называется модулем непрерывности функции (р на множестве Е.
Важным свойством модуля непрерывности ш(<р,6) является следующее: из непрерывности функции <р(£) на компакте Е вытекает, что ее модуль непрерывности является непрерывной функцией параметра 5 ^ 0, причем
lim ш((р. 5) = 0.
Из определения модуля непрерывности и формул (3), (5), (6) вытекает, что для функции h(z) при z G Z, 6 ^ 0 имеет место неравенство
u(h, S) < w(/o, S) + ш(да, 5) + Ц/, S) + ш(д, S). (27)
Лемма 3. При 5 ^ 0 справедливы неравенства
(28)
ш(д0,6)^Ш(д,8), (29)
где х € X, у €Y, z € Z.
Доказательство. Остановимся на доказательстве неравенства (28). Фиксируем произвольное á ^ 0 и векторы у', у" из Y, такие, что |у' — у"\ ^ 5. В силу формулы (5) при некоторых ж', х" из X /о(у') = f(x',y'), /о(у") = Кх"-,у")- Отсюда и из (5) получаем следующие неравенства:
/о(у') - /о(у") < /(ж', у') - /(ж', у") < Ц/,£), /о(у") - /о(у') < /(ж", у") - /(ж", у') < w(/,í).
Отсюда следует неравенство
|/о(у')-/о(Л1
Учитывая произвольность 5 ^ 0 и векторов у', у" G Y, удовлетворяющих неравенству |у' — у"| ^ 5, получаем отсюда неравенство (28). Неравенство (29) с помощью формулы (6) доказывается аналогичным образом.
Из леммы 3 и (27) при 6^0 вытекает неравенство
w(M) < 2w(/,£) + 2w($,£). (30)
Фиксируем £ > 0 и S = 6(e) > 0 столь малое, что
4,
Тогда на основании соотношения (30) получаем неравенство
u(h,á(e))^e. (31)
Отсюда вытекает, что при z',z" € Z и таких, что |z' — z"\ ^ выполняется неравенство
\h(z') — h(z")I ^ е. Из вышесказанного следует, что при 21 ф 0 выполняется равенство г/ = 0 и существует такая точка zq G /í. что
/г(^о) = 0. (32)
Из определения величины 7(W) (см. (19)) и неравенств (21), (31) следует, что при
a(U) + ß(V) < 5(e) (33)
для точки zq (см. (32)) найдется такая точка z* G W, что
0 < h(z*) < е. (34)
Из сказанного вытекает, что при выполнении неравенства (33) верно искомое неравенство (26), а следовательно, и неравенство (25). Из формул (3), (34) следуют неравенства (ср. с (13), (14) при ß ^ е)
max/(С,у*) sí /(ж*,у*) + е, тах/(ж*,т?) sí g(x*,y*) + е,
íjGl
где z* = (ж*,y*) éWcZ. Таким образом (см. (13), (14)), точка z* является е-равновесием по Нэшу для изучаемой игры. Используя непрерывность функции h(z) и тот факт, что точки множества 21 исчерпываются корнями уравнения h(z) = 0, от противного можно показать, что для любой последовательности чисел £/., к = 1,2,..., где ej¡ > 0 и е^ 0 при к ^ оо, расстояние от точки до компакта
21 стремится к 0 при к ^ оо. В частном случае, когда 21 состоит из одной точки С (г Z. имеет место сходимость последовательности к ( при к ^ оо. Отметим, что в [8] получены достаточные условия на игру, при которых множество 21 одноточечно.
В заключение отметим, что в [9] изложен градиентный приближенный метод нахождения точек равновесия. Такого рода методы требуют от /(ж, у), д(х, у) большей гладкости, нежели непрерывность на Z.
СПИСОК ЛИТЕРАТУРЫ
1. Партхасаратхи Т., Рагхаван Т. Некоторые вопросы теории игр двух лиц. М.: Мир, 1974.
2. My лен Э. Теория игр с примерами из математической экономики. М.: Мир, 1983.
3. Пет рос ян J1. А., Зенкевич Н. А., Сёмина Е. А. Теория игр. М.: Высшая школа, 1998.
4. Васин А. А., Морозов В. В. Теория игр и модели математической экономики. М.: МАКС Пресс, 2005.
5. Мащенко С. О. Концепция равновесия по Нэшу и ее развитие // J. Comput. and Appl. Mathematics. 2012. N 1(107). P. 40-65.
6. Nikaido H., Isoda K. Note on noncooperative convex games // Pacific J. Mathematics. 1995. 5. Suppl. 1. P. 807-815.
7. Фёдоров В. В. Введение в минимакс. М.: Наука, 1972.
8. Rosen J. В. Existence and uniqueness of equilibrium points for concave iV-person games // Econometrica. 1965. 33. N 3. P. 520-534.
9. Antipin A. Gradient approach of computing fixed points of equilibrium problems //J. Global Optimization. 2002. 24. P. 285-309.
Поступила в редакцию 08.11.13
APPROXIMATE CALCULATION OF NASH EQUILIBRIUM POINTS FOR GAMES OF TWO PLAYERS
Nikolskii M. S.
In the paper it is developed some approximate method for calculation of Nash equilibrium points in general games of two players.
Keywords: games of two players, Nash equilibrium points, approximate calculation.