Научная статья на тему 'Равновесие, сдерживаемое контругрозами, и сложное равновесие в безопасных стратегиях'

Равновесие, сдерживаемое контругрозами, и сложное равновесие в безопасных стратегиях Текст научной статьи по специальности «Математика»

CC BY
275
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАВНОВЕСИЯ В БЕЗОПАСНЫХ СТРАТЕГИЯХ / БЕСКОАЛИЦИОННЫЕ ИГРЫ / АСИММЕТРИЧНОЕ ПОВЕДЕНИЕ. / EQUILIBRIUM IN SECURE STRATEGIES / NON-COOPERATIVE GAMES / ASYMMETRIC BEHAVIOR

Аннотация научной статьи по математике, автор научной работы — Искаков Михаил Борисович, Искаков Алексей Борисович

Представлены два расширения концепции равновесий в безопасных стратегиях. В равновесии, сдерживаемом контругрозами (РСК), ни один игрок не может увеличить свой выигрыш односторонним отклонением, не создавая при этом угрозы потерять больше, чем он выигрывает. Такое условие должно соблюдаться для любых равновесий в расширенном смысле, и потому любые такие равновесия должны принадлежать множеству РСК. В качестве второго расширения рассмотрены сложные равновесия в безопасных стратегиях. Предложенная концепция позволяет выявлять иерархическую структуру взаимных угроз между игроками и будет полезна для анализа задач, в которых возможно асимметричное поведение игроков. Приведены примеры предложенных равновесий в матричных играх и общие алгоритмы их нахождения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Equilibium contained by counter-threats and complex equilibrium in secure strategies

We present two generalizations of the concept of equilibrium in secure strategies. In equilibrium contained by counter-threats (ECCT) no player can increase his or her payoff by a unilateral deviation without creating a threat to lose more than he or she wins. We assume that this condition must be satisfied for any pseudo-equilibrium in the generalized sense, and, therefore, any such equilibrium must belong to the set of ECCT. The second generalization is the complex equilibrium in secure strategies. The proposed concept allows us identifying a hierarchical structure of mutual threats between players and will be useful for the analysis of problems with asymmetric behavior of the players. Search algorithms for proposed equilibria and their examples in the matrix games are provided.

Текст научной работы на тему «Равновесие, сдерживаемое контругрозами, и сложное равновесие в безопасных стратегиях»

УДК 519.833 ББК 22.18

РАВНОВЕСИЕ, СДЕРЖИВАЕМОЕ КОНТРУГРОЗАМИ, И СЛОЖНОЕ РАВНОВЕСИЕ В БЕЗОПАСНЫХ СТРАТЕГИЯХ1

Искаков М. Б.2, Искаков А. Б.3

(ФГБУН Институт проблем управления им. В.А. Трапезникова РАН, Москва)

Представлены два расширения концепции равновесий в безопасных стратегиях. В равновесии, сдерживаемом контругрозами (РСК)), ни один игрок не может увеличить свой выигрыш односторонним отклонением, не создавая при этом угрозы потерять больше, чем он выигрывает. Такое условие должно соблюдаться для любых равновесий в расширенном смысле, и потому любые такие равновесия должны принадлежать множеству РСК. В качестве второго расширения рассмотрены сложные равновесия в безопасных стратегиях. Предложенная концепция позволяет выявлять иерархическую структуру взаимных угроз между игроками и будет полезна для анализа задач, в которых возможно асимметричное поведение игроков. Приведены примеры предложенных равновесий в матричных играх и общие алгоритмы их нахождения.

Ключевые слова: равновесия в безопасных стратегиях, бескоалиционные игры, асимметричное поведение.

1 Работа выполнена при финансовой поддержке РФФИ в рамках проекта №14-01-00131-а.

2 Михаил Борисович Искаков, кандидат технических наук (mih_iskakov@mail. т).

3 Алексей Борисович Искаков, кандидат физико-математических наук (isk_alex@mail.ru, iskakov@ipu.ru).

1. Введение

Данное исследование является прямым развитием статьи [8]. В этой работе была предложена новая формулировка концепции равновесия в безопасных стратегиях (РБС), описывающая модель осторожного поведения в некооперативных играх. Модель основана на понятии угрозы, представляющей игровую ситуацию, когда один игрок односторонним отклонением может увеличить свой выигрыш и одновременно уменьшить выигрыш другого игрока. РБС определяется двумя условиями: условием безопасности и условием отсутствия улучшающих безопасных отклонений. Условие безопасности означает, что ни для одного из игроков нет угроз. Отсутствие улучшающих безопасных отклонений означает, что ни один игрок не может односторонним отклонением увеличить свой выигрыш, не создав при этом для себя угрозы потерять больше, чем он выигрывает. Предложенное определение оказалось конструктивным и позволило обнаружить убедительные по содержательному смыслу решения в нескольких хорошо известных экономических играх, не имеющих равновесия по Нэшу: модель пространственной конкуренции Хотеллинга [7], модель борьбы за ренту Таллока [10], модель рынка страхования Ротшильда-Стиглица-Вильсона, модель рыночной дуополии Бертрана-Эджворта [8]. Предложенная концепция РБС может быть также применена к исследованию соревновательных систем стимулирования [3] и рассматриваться в качестве одного из перспективных направлений теоретико-игрового моделирования [1].

В предлагаемом исследовании была сделана попытка ослабить условия РБС, чтобы расширить и обобщить понятие данного равновесия. Авторы стремились получить такое обобщение, которое имело бы убедительный экономический смысл при разрешении известных игровых задач и сохраняло бы общую логику РБС, основанную на понятии угрозы. В определении РБС заложено предположение, что каждый игрок избегает угроз (условие безопасности). Это условие является довольно «сильным». Для ряда игр (например, в модели продуктового соревно-

вания или в модели Бертрана-Эджворта при некоторых значениях параметров) анализ с точки зрения наличия угроз показал, что любой профиль обязательно содержит угрозы для тех или иных игроков. В то же время некоторые угрозы являются «потенциальными» и не реализуются на практике, поскольку недостаточно обоснованы. В таком случае игроки отказываются от их применения. Было бы естественно предположить, что в этих случаях участники игры также руководствуются соображениями безопасности, но учитывают не все угрозы, а только обоснованные в том или ином смысле.

Самым естественным ослаблением требований РБС является просто отбрасывание требования первого условия (безопасности). Можно рассмотреть положение, когда ни один игрок не может односторонним отклонением увеличить свой выигрыш, не создав при этом угрозы потерять больше, чем он выигрывает. Такое положение можно назвать равновесием сдерживаемым контругрозами (РСК), поскольку в нём на любое улучшающее одностороннее отклонение игрока существует «контругроза». Достоинством такого подхода является существование равновесий для очень многих игр (хотя в статье приводится пример игры, для которой РСК не существует). Но основной недостаток является другой стороной достоинства: равновесий оказывается много, и возникает проблема выбора игроками из этого множества РСК наиболее устойчивых в каком-то смысле точек.

Дальнейшей целью исследования было предложить такое ослабление определения РБС и усиление определения РСК, которое могло бы убедительно «поймать» и описать логику безопасного поведения игроков, когда они учитывают не все существующие угрозы, а более узкий класс обоснованных угроз. Поскольку РБС исключает все угрозы, а РСК - разрешает их, то избирательный подход к угрозам задает промежуточное положение. Основанием избирательности при рассмотрении угроз, какие из них учитывать, а какие - игнорировать, был избран принцип декомпозиции угроз по игрокам. В определении сложного РБС множество игроков делится на классы, которые неодинаково относятся к угрозам друг друга, а именно: игрок в

своем поведении учитывает угрозы, исходящие от игроков своего или более высокого класса, и игнорирует угрозы от игроков более низкого класса. Такой подход был предложен в [2] для исследования задачи многопартийной конкуренции Даунса. Предложенное определение сложного РБС позволяет исследовать несимметричные относительно игроков взаимодействия. Такая несимметрия игроков на практике может определяться как внешними параметрами - размером их ресурсов, положением на рынке, неодинаковыми правилами игры и т.п., так и складываться стихийно в ходе игры посредством рационального выбора ролей самими игроками. Не вдаваясь в подробности, зависящие от специфики конкретной модели, мы просто предполагаем, что на множестве игроков либо задана предварительно, либо возникает спонтанно в ходе самой игры упорядоченность игроков по степени учета угроз друг друга.

Вводимые определения поясняются на матричных примерах. После введения общего определения сложного РБС дальнейшее рассмотрение сосредотачивается на наиболее простых случаях. В цепочечных РБС каждый класс состоит только из одного игрока. Таким образом, для игр двух участников существуют только три случая: простое РБС и две симметричных цепочки, в которых один из игроков считает для себя возможными только безопасные стратегии, а другой допускает такие угрозы, на которые он может ответить контругрозами. Для этого случая доказано два результата. Во-первых, в игре с непрерывными целевыми функциями точка Штакельберга является слабым сложным РБС. Во-вторых, для широкого класса разрывных игр двух участников сложное е-РБС существует всегда.

Статья организована следующим образом. В разделе 2 мы напомним необходимые определения из нашей предыдущей работы. В разделе 3 представлена концепция РСК и указан конструктивный способ выделения множества РСК. Концепция сложных РБС представлена в разделе 4, где приведены примеры таких равновесий в матричных играх и общий алгоритм их нахождения. В следующем разделе мы обобщаем концепцию наилучшего безопасного ответа из [8] применительно к слож-

ным РБС и доказываем, что всякое сложное РБС является наилучшим избирательно безопасным ответом. В разделе 6 исследуются сложные РБС в играх двух участников и их связь с концепцией точек Штакельберга. Наконец, в разделе 7 сформулированы е-ослабления для предлагаемых концепций, которые могут оказаться полезными при исследовании разрывных игр.

2. Равновесие в безопасных стратегиях

Равновесия в безопасных стратегиях были предложены в работах [2, 6]. Напомним в этом разделе определения РБС в новой форме из статьи [8], которые нам понадобятся в качестве основы для дальнейших построений. Рассмотрим произвольную игру в нормальной форме Г = [Ы, X, ЩХ)}.

Определение 1. Угрозой игрока / игроку 7 (/ ^ 7) называется пара профилей [х, (х/, х_/)} такая, что и/ (х/, х_/) > щ (х) и и7 (х/, х_) < и7 (х). При этом профиль х называется содержащим угрозу, а профиль [х, (х/, х_)}, так же как и стратегия х/, называются угрожающими игроку 7 со стороны игрока

Определение 2. Стратегия х7 игрока 7 называется безопасной стратегией при заданной обстановке х_7, если профиль х не содержит угроз игроку 7. Профиль стратегий х называется безопасным профилем, если все его стратегии безопасны.

Множество всех профилей, в которых стратегии игрока 7 безопасны, будем обозначать как Qi с X, а множество всех безопасных профилей как Q с X.

Определение 3. Безопасным отклонением игрока 7 от профиля х называется стратегия х'7 такая, что и7 (х'7, х_7) > и7 (х) и и7 (х'7, х/, х_7/) > и7 (х) для любой угрозы [(х'7, х_7), (х'7, х/, х_7/)} игрока / игроку 7.

Определение 4. Безопасный профиль стратегий называется равновесием в безопасных стратегиях (РБС), если ни один игрок не может увеличить свой выигрыш безопасным отклонением.

Чтобы для каждой игры сделать более наглядной силу угроз, содержащихся в стратегиях и профилях, определим соот-

ветствующую ей игру максимальных угроз с функцией выигрыша с учетом угроз.

Определение 5. Для заданной игры Г = [Ы, X, и(Х)} игрой максимальных угроз называется игра Г = [Ы, X, У(Х)} с целевыми функциями

V, (X) =

^ и1 (х', х_ .), если х1 -

У,х. :и. (х. ,х-. )>и. (х)

- небезопасная стратегия для игрока ■ ui (х), если х1 - безопасная стратегия для игрока ■

Функцию V, (х) назовём функцией выигрыша с учетом угроз

игрока

Также определим ослабления определений РБС из [8], которые нам потребуются в дальнейшем.

Определение 6. Безопасное отклонение х\ игрока ■ от профиля х называется слабым, если существует угроза [(х', х_,), (х'ь х', х_у)} игрока у игроку ■ такая, что и, (х'■, х', х_у) = и, (х). В противном случае безопасное отклонение х\ называется строгим.

Определение 7. Безопасный профиль называется слабым РБС, если ни один игрок не может увеличить свой выигрыш строгим безопасным отклонением.

3. Равновесие сдерживаемое контругрозами

Естественное обобщение РБС можно получить путём отказа от условия безопасности профиля в определении РБС. Такая возможность впервые предложена в [9].

Определение 8. Профиль стратегий называется равновесием, сдерживаемым контругрозами (РСК), если ни один игрок не может увеличить свой выигрыш безопасным отклонением.

Выбранное название определяется тем обстоятельством, что любые отклонения от профиля РСК блокируются «контругрозами» в следующем смысле.

Определение 9. Отклонение х', от профиля х такое, что и, (х',, х_,) > и, (х), называется сдерживаемым, если (х',, х_,) содержит угрозу игроку ¿: {(х',, х_г), (х',, х), х^,)} такую, что щ (х',, х), х) < ui (х). Эта угроза называется контругрозой игрока) на отклонение х', .

Тогда РСК можно определить следующим эквивалентным образом.

Определение 10. Профиль стратегий называется равновесием сдерживаемым контругрозами (РСК), если на любое улучшающее отклонение игрока существует контругроза.

Определим также ослабление РСК, которое будет полезно в дальнейшем.

Определение 11. Профиль называется слабым РСК, если ни один игрок не может увеличить свой выигрыш строгим безопасным отклонением.

Найдем теперь множество всех РСК. Для произвольной игры в нормальной форме Г = {Ы, X, и(Х)} построим игру максимальных угроз Г = {Ы, X, У(Х)}. Для всех , е N и всех х^ е X. рассмотрим множество

(1) (х-, ) =\х : Щг (хг, х-{) ^ ^Р V,- (х^ х) Х{ .

I х;еХ, ]

Введем следующие множества:

N

(2) Y¡ = {х: х, е^,(х_,)} сX, Y = ПY¡ .

¿=1

Тогда множество РСК можно охарактеризовать следующим образом.

Утверждение 1. Множество Y, введённое в (2), является множеством всех слабых РСК игры Г.

Доказательство непосредственно вытекает из введённых определений. Множество (х_,) - множество стратегий игрока , при окружении х^, , из которых он не может увеличить свой выигрыш строгим безопасным отклонением. Y¿ - множество профилей, в которых игрок , не может увеличить свой выигрыш строгим безопасным отклонением.

Предложенная концепция позволяет «поймать» возможные равновесия там, где «не срабатывают» концепции равновесия Нэша и РБС. Простым примером такого РСК является положение в игре дилеммы заключённого, когда оба игрока выбирают стратегию «молчать». В недавней презентации [11], посвящённой исследованию РСК (под наименованием: «равновесие Нэша 2»), были приведены примеры таких равновесий и доказан важный результат, что в любой строго соревновательной игре существует РСК. В то же время во многих играх множество РСК оказывается слишком широким, и возникает проблема отбора равновесий. Приведём пример игры, в которой РСК не существует.

Пример 1. Игра трёх игроков, в которой нет РСК.

¿1 Ь2 _

С2:

ci:

a1 a2

(0,0,0) (1,2,2) (2,2,1) (2,1,2)

b1 b2

a1 (2,1,2) (2,2,1)

a2 (1,2,2) (0,0,0)

Ya = {(a2, К C1 X (a2, Ь2 , Cl),(al, К Ь2, C2)}

Yb = {Ц, b2, ci),(a2,c1),(a1, b2, c2),(a2,C2)} Yc = {(a1, b2, q),(a2, b2, ^ХЦ,c2),(a2,C2)}

Y = Y n Yb n 7=0

abc

С другой стороны, здесь имеется цикл угроз:

(abc ) -^(a2b2c)-(a2bxc2) ——>(aPf2)-

b^c

Mabc)-

Ma1b2c2)-

-»(a^c )

Вероятно, в полиматричных играх отсутствие РСК должно быть связано именно с наличием таких циклов, в которых на каждом шаге какой-либо игрок улучшает свое положение, но, может быть, реализуя угрозу другому игроку, который таким же образом улучшает свое положение на другом шаге этого же цикла, который расположен до данного шага более чем на одно звено.

4. Сложное равновесие в безопасных стратегиях

Следующий шаг в построениях - опираясь на близость двух конструкций равновесия, РБС и РСК, попытаться построить промежуточное множество, более узкое, чем РСК, но более широкое, чем РБС. Поскольку различие между РБС и РСК по определению заключается в том, что РСК разрешает все угрозы, а РБС запрещает их, то такой промежуточный подход может задаваться посредством избирательности при рассмотрении разных угроз, признании части из них серьёзными, обоснованными, и игнорировании остальных. В качестве основания такой избирательности предлагается взять декомпозицию угроз по игрокам, от которых они исходят. В дальнейшем определении сложного РБС множество игроков делится на классы, которые неодинаково относятся к угрозам друг друга. Игрок, принадлежащий к определенному классу, выбирая свои избирательно безопасные стратегии, учитывает (т.е. избегает) угрозы, исходящие от игроков своего или более высокого класса, и игнорирует (т.е. допускает) угрозы от игроков более низкого класса. Руководствуясь изложенным смыслом, сформулируем строгие определения.

Определение 12. Стратегия xi игрока / в профиле х называется безопасной от угроз игрока у Ф / при заданных стратегиях других игроков х^, если профиль х не содержит угроз для игрока / со стороны игрокау'.

Определение 13. Безопасным от угроз игрока j отклонением игрока ^ у Ф ¡, от профиля х называется стратегия х\ такая, что щ (х'г-, х_г) > щ (х) и щ (х'г-, х', х_у) > щ (х) для любой угрозы у ^ /' : {(х'„ х-), (х'„ х', х_„)}.

Определение 14. Профиль стратегий называется сложным РБС, если существует разбиение множества игроков N на непустые и непересекающиеся подмножества N1, ..., Nm такие, что стратегия каждого игрока из множества N1 является безопасной от угроз игроков из множества и кк<т Nk, и каждый игрок из множества N1 не может увеличить свой выигрыш отклонением, безопасным от угроз игроков множества

и 1<к<т N. Сложное РБС называется цепочечным, если все множества N1 состоят только из одного игрока.

Важно отметить, что хотя в сложном РБС допускаются угрозы игрокам более высоких классов со стороны игроков более низких классов, но все такие угрозы (согласно определению) будут небезопасными отклонениями для самих игроков более низких классов. Иными словами, все угрозы, существующие в сложном РБС, сдерживаются контругрозами, т.е. «безнаказанных» угроз в нём нет.

Отметим также следующий факт. Если условие безопасности профиля рассматривается относительно угроз со стороны игроков из более узкого множества, то множество потенциальных равновесий расширяется. Однако когда рассматриваются профили, в которых отсутствуют отклонения, безопасные относительно угроз более узкого множества игроков, то множество таких профилей сужается. Поэтому приведённое определение в частности подразумевает, что в сложном РБС ни у кого из игроков нет безопасных улучшающих отклонений (т.е. безопасных относительно всех угроз).

В качестве ослабления приведённого выше определения введём также понятие слабого равновесия.

Определение 15. Профиль стратегий называется слабым сложным РБС, если существует разбиение множества игроков N на непустые и непересекающиеся подмножества N ..., Nm такие, что стратегия каждого игрока из множества N1 является безопасной от угроз игроков из множества и 1<1с<т N, и каждый игрок из множества N1 не может увеличить свой выигрыш строгим безопасным отклонением от угроз игроков множества и ^<т Nk.

Обозначим множество РБС как ХРБС с X , множество РСК как ХРСК с X и множество сложных РБС как ХСРБС с X . Тогда справедливо следующее включение:

Утверждение 2 ХРБС с ХСРБС с ХРСК.

Доказательство. ХРБС с ХСРБС, поскольку РБС является сложным РБС с разбиением N =

ХСРБС с ХРСК , поскольку в сложном РБС любой игрок из N не может увеличить свой выигрыш отклонением безопасным от игроков из множества и 1<к<т Ык , и следовательно, он тем более не может увеличить свой выигрыш отклонением безопасным от угроз игроков из более широкого множества N. □

Следствие 1. Всякое сложное РБС лежит в множестве Y, введённом в (2).

Пример 2. Сложное РБС в игре двух игроков. Пусть два игрока-государства могут выбирать одну из двух стратегий: первая - миролюбивая, вторая - агрессивная. Первый игрок является развитым (богатым) государством, второй игрок -отсталым (бедным). Матрица выигрышей: ' (0,0) (-3,2) Л ч(-1,1) (-2, -2),

Миролюбивая нейтральная политика стран дает базисные нулевые размеры выигрышей - (0, 0). Мирная оккупация отсталой страны дает ей доступ к возможностям развитой страны, а для развитой страны она означает неэффективные траты ресурсов на колонию - это соответствует выигрышам (-1, 1). Агрессия отсталой страны против неготовой к этой агрессии передовой означает большие потери для передовой страны и выигрыш для отсталой - получаем выигрыши (-3, 2). И наконец, двусторонняя война дает большие потери для обеих сторон (-2, -2). В игре нет равновесий Нэша и РБС, найдём множество Y.

У1 = [ (мир, мир), (война, мир), (война, война)}, У2 = [ (мир, мир), (мир, война), (война, мир)}, У = У1^ У2 = [(мир, мир),(война, мир)}. В множестве У имеются следующие сложные РБС. Сложное РБС (мир, мир) с выигрышами (0, 0): N = [2}, Ы2 = [1}. Отсталая страна безопасна, так как развитой невыгодно начинать войну. Развитая страна имеет угрозу войны от отсталой, но эта угроза сдерживается контругрозой ответной войны. Сложное РБС (война, мир) с выигрышами (-1, 1): N = [1}, Ы2 = [2}. Развитая страна безопасна, так как отста-

лой оккупация выгодней, чем борьба за освобождение. Отсталая страна имеет от развитой угрозу окончания оккупации, но эта угроза сдерживается контругрозой агрессии со стороны освободившейся колонии.

Пример 3. Сложное РБС в игре трёх игроков. Аналогичная ситуация, но игроков три: первый - развитый, второй - средний, третий - отсталый. Стратегий по-прежнему две: мир (м) и война (в). Предполагается, что агрессия направляется одновременно на обоих соседей. Матрица выигрышей:

Ь1 Ь2 Ь1 Ь2

С\: а1 а2 (0,0,0) (-1,1,1) (-3,2,1) (-2,-2,1) С2: а1 а2 (-3,-3,2) (-2,-3,-2) (-3,-2,-(-2,-2,- 2) 2)

В игре нет равновесий Нэша и РБС, найдём множество Y.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

У = {(м, м, м),(в, м, м),(в, в, м),(в, м, в),(в, в, в)}, У2 = {(м, м, м),(м, в, м),(в, м, м),(м, в, в),(в, в, в)}, У3 = {(м, м, м), (м, в, м), (в, м, м), (в, в, м), (м, м, в), (м, в, в)}, У = У п У2 п У3 = {(м, м,м),(в, м,м)}.

В множестве У имеются следующие сложные РБС. Сложное РБС (мир, мир, мир) с выигрышами (0, 0, 0): N = {3}, N = {2}, N = {1}. Это цепочечное сложное РБС: агрессивность третьего игрока сдерживается контругрозой со стороны как первого, так и второго, агрессивность второго - контругрозой со стороны первого, а первому агрессивность невыгодна. Сложное РБС (война, мир, мир) с выигрышами (-1, 1, 1): N = {3}, N = {2, 3}. Развитая страна оккупирует две других, и они оказываются в выгодном положении модернизируемых колоний. Но развитая страна не может уйти из колоний из-за контругрозы появления в них агрессивности. Разумеется, данный пример не претендует на адекватность изображения отношений между государствами. Он только иллюстрирует содержательный смысл понятия сложного РБС.

Исследуем теперь более подробно множество сложных РБС. Укажем алгоритм проверки, что профиль у является сложным РБС. Прежде всего, в соответствии с утверждениями 1 и 2,

профиль у должен лежать в множестве У. Поэтому рассмотрим произвольный профиль у е У. Рассмотрим тех игроков (если они существуют), стратегии которых в этом профиле безопасны. Выберем некоторое подмножество таких игроков 11. Зафиксируем стратегии этих игроков у , ц е 11. Рассмотрим игру оставшихся игроков:

Г\1 = ^ \ /1, X,, щ (х_4, у.), е N \ /1, , е /1).

Набор стратегий игры обозначим как ха е X\l . Рассмотрим игрока е в игре Г\1. Его функция выигрыша с учётом угроз в соответствующей игре максимальных угроз Г\1:

у?(х,, х^) > V, (х, х_,.), х" е X\ 1\X,. Новой игре соответствует новое множество равновесий, сдерживаемых контругрозами У\1 . Предположим, что уа е У\1 . Так как для игры Г\1

и-(хг,х*) = щ(х,,х^,у4) и ^(х,,х^) > V,(х,,х^,у4), то множество У\1 может быть уже или равно, чем соответствующий срез множества У: У\1 с {хи : (хи, у.) е У}. Таким образом, в

новой игре могут появляться новые игроки, стратегии которых безопасны в точке уа проекции точки у на множество X\1 .

Выделим подмножество /2 игроков, имеющих безопасные стратегии в точке у1 в игре Г\1. Тогда можно зафиксировать, в свою очередь, эти безопасные стратегии игроков из множества /2 и аналогичным образом построить новую усеченную игру Г\2. Такой процесс построения множеств 1к и Г^ может продолжаться до тех пор, пока на некотором шаге т не произойдет один из двух случаев. Во-первых, всё множество игроков может исчерпаться, т.е. может оказаться, что

(3) N = У /к .

к

к=1

\(т-1)

Во-вторых, может оказаться, что у ё У\(т-1) либо стратегии всех игроков усеченной игры не являются безопасными, т.е.

(4) у^ Й 7Чт_1) либо 1т = 0,N Ф и 1к .

к=1

Утверждение 3.. Профиль у является сложным РБС тогда и только тогда, когда существует ветвь алгоритма, для которой выполняется (3).

Доказательство. Достаточность. Пусть выполняется (3). Для произвольного игрока / е 1к на к-м шаге алгоритма имеется игра Г\к_1 с игроками из множества N \ и 1<1<к—1 I = и к<1<т I . В данной игре игрок / из множества 1к имеет безопасную стратегию. То есть игрок / в игре Г имеет безопасную стратегию от игроков из множества и к<1<т 11. Кроме того, в алгоритме предполагается, что профиль У(к-1) е Х\(к_1) принадлежит множеству РСК Т\к_1 игры Г\к_1 , т.е. игрок / не может увеличить свой выигрыш безопасным отклонением в игре Г\к_1. Следовательно, игрок / не может увеличить свой выигрыш отклонением, безопасным от угроз игроков из множества и к<1<т II в игре Г. Два доказанных свойства являются определением сложного РБС с множествами Nk = 1к , к = 1, ..., т.

Необходимость. Пусть у - сложное РБС с множествами игроков N1 , I = 1, ..., т. Тогда игроки из множества М имеют в игре Г стратегии, безопасные от любых игроков, и не могут увеличить свой выигрыш безопасным отклонением. Выберем 11 = ^ и получим игру Г\1 и т.д. Рассмотрим игру Г\к_1 на к-м шаге. Так как в игре Г игрок / е Nk имеет стратегию, безопасную от игроков из множества и к<1<т и не может увеличить свой выигрыш отклонением, безопасным от игроков из множества и к<1<т N1 , то в игре Г\к_1 с множествами ^ = Щ I = 1, ..., к_1, этот же игрок / имеет безопасную стратегию и не может увеличить свой выигрыш безопасным отклонением. □

Таким образом, поиск сложных РБС сводится к поиску в множестве У точек, для которых выполняется (3). На первом шаге процесса нахождения множества сложных РБС игры требуется найти в У профили, безопасные хотя бы для одного игрока, т.е. профили из У П Qi, / е N, где Qi _ множества профилей, в которых стратегии игрока / безопасны. Для любого х е У верно

ui (x) > max vt (x', x_t). Для любого x e Qi верно

x'eX;

u. (x) = vi (x) < max vi (x', x_t). То есть искомые профили

x'i eXl

x e Y П Qi будут экстремальными точками, минимизирующими на множестве Y и максимизирующими на множестве Qi выигрыш игрока i. Множество сложных РБС лежит внутри множества всех таких экстремальных точек:

хСРБС с U(YПQ,).

ieN

На следующем шаге для найденных точек следует провести декомпозицию игры по игрокам и для полученных игр с меньшим количеством игроков найти точки, безопасные для кого-либо из оставшихся. Конечно, в общем случае такой «алгоритм» действий, требующий нахождения избирательно безопасных профилей в континуальном количестве декомпозированных игр (для каждой точки x e U (Y П Qi) получается своя игра) выгля-

ieN

дит абсолютно нереализуемым. Но, тем не менее, можно надеяться, что анонимность игр, их симметрия по игрокам, соображения экстремальности искомых точек на множествах Y и Qi по целевым функциям отдельных игроков позволит для многих игр провести их декомпозицию по игрокам и рекурсивный поиск сложных РБС.

5. Наилучшие избирательно безопасные ответы

В [8] для анализа РБС использовалось понятие наилучшего безопасного ответа. Приведём здесь соответствующее определение и обобщим его применительно к случаю сложного РБС. Обозначим как Q(i)(x-i) с Xi множество безопасных стратегий игрока i при заданном окружении x-i. Доопределим Q(i)(x-i) = 0, если при таком окружении не существует безопасных стратегий для игрока i.

Определение 16. Стратегия xi называется наилучшим безопасным ответом на стратегии окружения x-i, если

(5) xi e Q(i)(x-i) и U (xi, x-i) = ,max "i (x', x-i ) .

Рассмотрим игрока i и некоторое множество других игроков L с N, i £ L. Обозначим как $(г)(х_г) множество стратегий игрока i, безопасных от угроз игроков из множества L при заданном окружении х_г . Если таких безопасных стратегий нет, то будем считать $ (0(х_,-) = 0.

Определение 17. Стратегия х называется наилучшим избирательно безопасным от игроков из множества L ответом на стратегии окружения х_г, если

(6) Х е ва( Х-1 ) и Пг (Х, Х-{) = тХ Пг (Х\, Х-{).

х е2(1)( х-,)

Для некоторых окружений х_ может оказаться $а)(х_1) = 0 (или даже Q(i)(x_i) = 0). В этом случае наилучший избирательно безопасный ответ (наилучший безопасный ответ) не определен.

Теперь можно сформулировать утверждение, связывающее понятия наилучшего избирательно безопасного ответа и сложного РБС, являющееся обобщением аналогичного утверждения для наилучшего безопасного ответа и РБС в [8].

Утверждение 4. Пусть х* _ сложное РБС с множествами игроков N ..., Ыт. Тогда для каждого игрока 1 е Ы1, 1 < I < т, стратегия х*1 будет наилучшим избирательно безопасным от игроков из множества и 1<к<т Ык ответом на стратегии окружения х —1. Обратное неверно.

Доказательство. Пусть х* - сложное РБС с множествами игроков N1, ..., Ыт . Рассмотрим 1 е N, 1 < I < т. Из определения сложного РБС: х"1 - безопасно от угроз игроков из множества и 1<к<т Nk. Если допустим, что в окружении х*_1 существует отклонение х\, безопасное от игроков из множества и 1<к<т Nk, такое, что и1 (х'1, х*_1) > и1 (х*), то игрок 1 может увеличить свой выигрыш избирательно безопасным отклонением в х'1 . Тогда х* не является сложным РБС с множествами игроков 1 е N1 , 1 < I < т. Обратное утверждение неверно. Контрпример: ((0,0) (2,2) (2,2) ^ (2,2) (1,3) (3,1) (2,2) (3,1) (1,3)

Профиль (0, 0) является профилем наилучших безопасных ответов, но не является РБС. □

Следствие 2. Если i е N1, то x*t - наилучший безопасный ответ на x*-i. Если {i} = Nm, то x*t - наилучший ответ на x*-i.

6. Сложные РБС и точки Штакельберга в играх двух участников

В играх двух участников имеет место очень упрощенный случай, когда угрозы и контругрозы могут исходить только от одного единственного соперника. Это позволяет существенно упростить анализ игры за счет исключения ситуации «треугольника», когда, например, контругрозу осуществляет не тот игрок, на которого напали, а третий. Это позволяет использовать понятие точек Штакельберга [12], которое именно для игр двух сторон оказывается тесно связанным с понятием сложного РБС. Рассмотрим матричную или непрерывную игру Г = {{1, 2}, (X1, X2), u1 (x1, x2), u2 (x1, x2)} с компактными пространствами стратегий Xi и непрерывными целевыми функциями ui . Следуя, например [4], определим точку Штакельберга для игрока i е {1, 2}:

Определение 18. Профиль x* называется точкой Штакельберга, если для i е {1, 2} выполняется x* е arg max ut (x', x_t),

(7)

i ^

*

x_t е arg max

v

min u_t (x", x'_i)

xi е arg max ut (x[,x'_t)

Определим связь между сложными РБС и точками Шта-кельберга.

Утверждение 5. Точка Штакельберга (7) в игре двух участников Г является слабым сложным РБС. Обратное неверно.

Доказательство. Пусть x* - точка Штакельберга (7). Поскольку x* е arg max ut (x', x_t), то игрок i не может увеличить

x' еХ1

свой выигрыш, и с его стороны не существует угроз. Рассмот-

x, еХ

рим любое улучшающее отклонение х'_г- игрока -i. В новом профиле содержится угроза {(x^-, х'-г), (x'i, х'-г)}, где

U (x', xV) = max и{ (x", x_),

x"eXl

u_ (x', x_) = min u_ (x'", x_),

x'ffeargmax ut (x", x_i)

и, следовательно, и-г- (x\, x'-i) < и-г- (x*). Если последнее неравенство выполняется строго, то отклонение x'-i является небезопасным. Если оно выполняется как равенство, то даже если отклонение x'-i и является безопасным, оно является слабым безопасным отклонением. Следовательно, x* - слабое сложное РБС c множествами N1 = {-i}, N2 = {i}.

Обратное неверно. Рассмотрим игру с двумя равновесиями Нэша. Пусть в первом из них выигрыши обоих игроков равны 2, а во втором они равны 1. Второе равновесие Нэша будет сложным РБС, но не будет точкой Штакельберга. □

Отсюда получаем следующий результат по существованию сложного РБС в игре двух участников.

Утверждение 6. В любой игре двух участников с компактными пространствами стратегий и непрерывными целевыми функциями существует слабое сложное РБС.

Доказательство. Следует из того, что все максимумы и ар-гмаксимумы в (7) всегда достигаются на компактных пространствах. Поэтому по крайней мере точки Штакельберга (7) всегда существуют. □

Тем не менее, множество сложных РБС шире, чем множество точек Штакельберга. Можно привести простой пример игры со сложным РБС, которое не является ни точкой Штакельберга, ни (обычным) РБС.

Пример 4. Сложное РБС в игре двух участников, не являющееся точкой Штакельберга. Рассмотрим следующую матричную игру:

tl t2 t3

S1 (0, 0) (1, 2) (4, 1)

S2 (3, 2) (2, 0) (-1, 0)

Легко проверить, что обе точки Штакельберга совпадают с профилем ($2, Ь) с выигрышами (3, 2). Однако профиль ($ь Ь) с выигрышами (4, 1) также является сложным РБС с порядком игроков ({^,{$}). Он не является (обычным) РБС, поскольку существует угроза игрока t отклониться из ($1, t3) в ($1, t2). Тем не менее, данное отклонение не безопасно из-за контругрозы игрока $ отклониться из ($1, t2) в ($2, t2). Поэтому если игрок t выберет в качестве «лидера» в сложном РБС стратегию осторожного поведения, он предпочтёт оставаться в профиле ($1, ^ с выигрышами (4, 1).

7. Ослабления концепций равновесий для разрывных игр

Понятия РБС и сложного РБС имеют особое значение для разрывных игр, в которых целевые функции игроков разрывны, поскольку именно в таких играх может не существовать равновесий Нэша. В этих играх максимальное значение функции выигрыша при заданном окружении может не достигаться, поэтому применительно к ним следует рассматривать не только понятия равновесий, но и их ослабления в форме е-аналогов этих равновесий. По сравнению со стандартными определениями в неравенствах появляется произвольно малая положительная величина е > 0 .

Определение 19. е-Безопасным отклонением игрока / от профиля х называется стратегия х\ такая, что щ (х'-, х-г) > щ (х) + е и щ (х'г-, х', х_у) > щ (х) + е для любой угрозы {(х', х-г), (х'г-, х', х_гу)} игрока у игроку ¡.

Определение 20. Профиль стратегий, содержащий угрозы не более чем на е (т.е. такие угрозы, что щ (х', х-) < щ (х) - е), называется е-равновесием в безопасных стратегиях, если ни один игрок не может увеличить свой выигрыш более чем на е е-безопасным отклонением.

Определение 21. Профиль стратегий называется е-РСК, если ни один игрок не может увеличить свой выигрыш более чем на е е-безопасным отклонением.

Определение 22. Профиль стратегий называется сложным s-РБС (s> 0), если существует разбиение множества игроков N на непустые и непересекающиеся подмножества N1, ..., Nm такие, что для каждого игрока из множества Nl существуют угрозы не более чем на е, от игроков из множества U i<k<m Nk, и ни один игрок из множества Nl не может увеличить свой выигрыш более чем на е е-безопасным отклонением от угроз игроков множества U l<k<m Nk.

Для игр двух участников аналогичным образом можно предложить следующее обобщение точки Штакельберга.

Определение 22. Профиль x* назовём s-точкой Штакельберга (s > 0), если

= sup ut (x', x—i), если супремум достигается, (8) щ (x*) ^

> sup и, (xi, x—i) - e, иначе;

xi eX,

(9) u-, (x) \

= sup w(x'_i), если супремум достигается, > sup w(x—) - e, иначе;

где (i, -i) e {(1, 2), (2, 1)} и функция w определена как

w( x_i) = <

inf

x, :u, (x, ,x_, )= sup u, (x[,x_l )

u—i (xi, x—i), если

супремум достигается,

lim

5^-0

Л

inf

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

x, :u, (x, ,x_, )> sup u, (x',x_,)—5

U_,(x, x_i)

иначе.

Наиболее важным для настоящего рассмотрения свойством е-точки Штакельберга является следующее.

Утверждение 7. Для любой игры двух участников с ограниченными целевыми функциями и любого е> 0 существует е-точка Штакельберга.

Доказательство. В случаях, когда супремумы достигаются, утверждение очевидно. Рассмотрим случай, когда они не достигаются. Если целевые функции в игре ограничены, то

х_, eX_,

x; ex.

функция w(x-t) определена при всех x-i . Выберем произвольное

s> 0 . Для него 3x-.: w(x-.) > sup w(x'_i) - e / 2 . Согласно определи

лению функции w(x*-t) также

33 < e: t inf t u t(x.,x-) > w(x-) - e/2.

xl :u. (xl ,x_; )> sup u (x',x_l )-3

x'.eX,

Это означает, что

3x* : ut (x*, x-) > sup ut (x', x-) - 3 и

x. eXl

u-i (x*, x-) > w(x-i) - e /2 > sup w(x'-i) - e.

x'-l

Таким образом, е-точка Штакельберга x* найдена. □

Теперь, используя существование е-точки Штакельберга, можно обобщить полученный ранее результат для игр двух участников с разрывными целевыми функциями u. Пусть BRs(xs) будет обозначать е-наилучший ответ на стратегию x. , т.е. множество {x.. | u(xi, x_t) > supu t(xi, x_t) - e} .

Утверждение 8. Пусть в разрывной игре Г двух участников для любых x. е X, . е {1, 2}, существует предел lim ut (xi, x_t). Тогда в игре Г существует сложное е-РБС.

s^+0 x-l eBRe (xl)

Доказательство. По существу аналогично доказательству для игр с непрерывными целевыми функциями и приводится в приложении A. □

Приведём простой пример того, как сложные е-РБС могут расширять концепцию решений в разрывной игре.

Пример 5. Рассмотрим стандартную модель дуополии Бертрана [5]. Две компании производят одинаковый товар, спрос ограничен и равен условной единице. Монопольная цена на рынке pM > 0. Компания, назначившая наименьшую цену, получает весь спрос, а если компании назначают одинаковую цену, они делят спрос пополам. В задаче существует единственное равновесие Нэша и единственное РБС: pi = p2 = 0. Тем не менее, сложными е-РБС являются также все точки (p, p - в), (p - s, p) для всех p е [0, pM ].

8. Заключение

В статье представлены два расширения концепции равновесий в безопасных стратегиях [8]. В качестве первого расширения мы рассмотрели ситуацию, в которой ни один игрок не может увеличить свой выигрыш односторонним отклонением, не создавая при этом угрозы потерять больше, чем он выигрывает. Такой профиль мы назвали равновесием сдерживаемым контругрозами (РСК), поскольку в нём любое выгодное отклонение игрока сдерживается «контругрозами». На практике, однако, мы обнаружили, что условие РСК оказывается слишком слабым и во многих играх таких равновесий оказывается слишком много. Тем не менее, можно предположить, что найденное условие должно соблюдаться для любого профиля, претендующего на роль равновесия. Оно выражает тот принцип, что в любом равновесном состоянии игры не должно быть безнаказанных выгодных отклонений. Таким образом, нахождение множества РСК имеет важное практическое значение, поскольку любые множества равновесий в расширенном смысле нужно искать в этом множестве. В работе предложен конструктивный метод выделения множества РСК с помощью функции выигрыша с учётом угроз и построения для игроков соответствующих множеств У-.

В качестве второго расширения концепции РБС была рассмотрена концепция сложных РБС, которая учитывает возможность неодинакового отношения игроков к безопасности в некооперативных играх. Множество сложных РБС строго включает в себя множество РБС, но строго включается в множество РСК. Каждому сложному РБС соответствует разбиение игроков на классы безопасности, которое можно назвать структурой сложного РБС. Идея такого расширения была впервые предложена в [2, 6]. В данной работе предлагается новая формулировка этой концепции. В общем случае одному и тому же сложному РБС могут соответствовать несколько разбиений игроков. Могут также существовать множественные сложные РБС с разными разбиениями игроков. Более того, число воз-

можных разбиений игроков растёт очень быстро с их числом. Все эти неудобства, однако, могут в значительной степени исчезать при рассмотрении отдельных классов игр. Например, в анонимных играх число возможных разбиений игроков существенно уменьшается. В других играх структура взаимных угроз может определяться правилами самой игры, например, размером ресурсов, доступных игроку, разным положением игроков на рынке или неравными правилами игры. В то же время важно отметить, что определение не налагает каких-либо ограничений на выбор разбиения игроков. Равновесная ситуация может возникать спонтанно в ходе самой игры в результате рационального выбора ролей самими игроками. В этом проявляется важное преимущество предлагаемого формализма: он выявляет возможность иерархической структуры взаимных угроз, которую нельзя выявить с помощью других подходов. Мы предполагаем, что предложенная теоретическая концепция будет полезна прежде всего для анализа задач, в которых возможно асимметричное поведение игроков, а такими являются почти все практические задачи.

В статье приведено несколько простых примеров, иллюстрирующих вводимые понятия. Особенно простую интерпретацию имеют сложные РБС в играх с двумя участниками. В этом случае один игрок выбирает безопасные стратегии и улучшает своё положение только безопасными отклонениями (т.е. ведёт себя так, как игроки ведут себя в РБС). Другой игрок выбирает наилучший ответ (т.е. ведёт себя так, как игроки ведут себя в равновесии Нэша). В таком случае сложные РБС оказываются тесно связанными с концепцией точек Штакельберга [4, 12]. В частности, точки Штакельберга в матричных или непрерывных играх с непрерывными целевыми функциями оказываются слабыми сложными РБС. Таким образом, в этих играх всегда существуют два слабых сложных РБС (которые могут также совпасть). В общем случае игр двух участников множество слабых РБС оказывается шире, чем множество точек Штакель-берга. Для разрывных игр двух игроков нами доказана теорема существования е-РБС.

Благодарности

Мы особенно признательны К. Д'Апремону, который помог нам найти новую формулировку концепции РБС. Выражаем признательность Ф.Т. Алескерову и Д.А. Новикову за постоянное внимание к нашей работе и за регулярные обсуждения концепции РБС на семинарах в Высшей школе экономики и Институте проблем управления им. В.А. Трапезникова в Москве. Благодарим М. Губко, Н. Коргина, В. Корепанова, М. Сандомирскую и Д. Федянина за полезные замечания и плодотворную дискуссию. Благодарим рецензента за ценные замечания. Работа выполнена при финансовой поддержке РФФИ в рамках проекта .№14-01-00131-а.

9. ПРИЛОЖЕНИЕ А

Утверждение 8. Пусть BRS (xi , s) будет обозначать е-наилучший ответ на стратегию xi, т.е. множество

{x 11 u(xi, x_t) > supu t(xi, X_t) - e} . Пусть в разрывной игре

x-i

Г = {(Xb X2), (u1, u2)} двух участников для любых xi е Xi-, i e {1, 2} существует предел lim ut (xi, x-i). Тогда в

s^+0 x— eBRe (xl)

игре Г существует сложное е-РБС.

Доказательство. Из предположения, что для любого xi е Xi-, i е {1, 2}, существует lim ut(xi,x-;), также следует,

s^+0 x— eBRe (xl)

что для любого xi e X, i e {1, 2} существует

ü. (xi) = lim sup ui (xi, x_t). Для произвольно малого s> 0

e^+0 x-,eBR, (xl)

выберем x"i такое, что üt(x*) > sup üi(xi) - e/5 . В соответствии с

x,eX,

исходным предположением, Vs> 0 3S > 0, S< s такое, что

Управление большими системами. Выпуск 51 | sup ut(x*,x-t) -üi(x*)|< e/5. Выберем x% e BRS(x**) такое,

X-1 eBR-s (x* )

что | ut(x*,x-) - sup ut(x*,x-t) |< e/5. Так, для произвольно

x-l eBR3 (x* )

малого положительного s существует точка (x**, x*_l) такая, что

u* (x*, x-) > üi (x*) - 2e /5 > sup г?* (xi) - 3e /5

xieXi

и u^. (x*, x-) > sup u t (x*, jc_i.) - S > sup u^. (x*, jc_i.) - e .

Эта точка является s-точкой Штакельберга с игроком лидером i и игроком последователем

Докажем, что она является сложным s-РБС. Для определённости рассмотрим случай * = 1, = 2. Прежде всего заметим,

что u2(x1,x2) > supu2(x1,x2) -e, т.е. игрок 2 не имеет никаких

x2

отклонений, увеличивающих его выигрыш более чем на s, и потому определение сложного s-РБС с разбиением игроков N = {1} U {2} выполняется для игрока 2.

Любое выгодное отклонение игрока 2 будет находиться в множестве BRS (x*i). Поскольку мы предполагаем, что существует lim u1( x1, x2), то, выбирая в нашем предыдущем рассмот-

S^+0 *2eBRs (*i)

рении S достаточно малым, мы можем гарантировать, что целевая функция игрока 1 не уменьшается более чем на s. Поэтому для игрока 1 в профиле (x*1, x*2) существуют угрозы не более чем на s.

Теперь предположим, что игрок 1 может увеличить свой выигрыш отклонением x'1. Если

u1(x|,x*) < й1(x[) + 2e/5 < sup й1(x1) + 2e/5 < u1(x*, x*) + e,

x1eX1

то отклонение игрока 1 x'1 не увеличивает его выигрыш более чем на s. Если u1(x|,x*) > ü1(x|) + 2e/5, то в соответствии с предположением для выбранного s> 0 3S'> 0, S'< s такое, что для Vx2 e BRS(x\) выполняется u1(x[,x'2) <щ(x[) + 2e/5. Таким образом, x*2 g BRS' (x\) и отклонение игрока 2 из x*2 в

Vx'2 е BRs (x\) выгодно для него. В то же время выигрыш игрока 1 строго уменьшается, и после контр-ответа игрока 2 он становится

u1(x[,x2) < й1(x[) + 2е/5 < sup й1(x1) + 2е/5 < u1(x*, x*) + e,

x1eX1

т.е. он не превосходит его выигрыша в (x*i, x*2) более чем на е. Иными словами, отклонение игрока 1 в x/1 не является е-безопасным отклонением. Следовательно, определение сложного е-РБС с разбиением игроков N = {1} U {2} также выполняется для игрока 1. □

Литература

1. АЛЕСКЕРОВ Ф.Т. Теоретико-игровое моделирование: попытка краткого обсуждения и прогноза развития // Журнал Новой экономической ассоциации. - 2013. -№17(1). - С. 181-184.

2. ИСКАКОВ М.Б. Равновесие в безопасных стратегиях // Автоматика и телемеханика. - 2003. - №3. - С. 139-153.

3. НОВИКОВ Д.А. Стимулирование в организационных системах. - М.: СИНТЕГ, 2003. - 312 с.

4. D'ASPREMONT, GERARD-VARET L A. Stackelberg-solvable games and pre-play communication // Journal of Economic Theory. - 1980. - Vol. 23(2). - P. 201-217.

5. BERTRAND J. Book review of theorie mathematique de la richesse sociale and of recherches sur les principles mathematiques de la theorie des richesses // Journal de Savants. -1883. - Vol. 67. - P. 499-508.

6. ISKAKOV M.B. Equilibrium in Safety Strategies and equilibriums in objections and counter objections in noncooperative games // Automation and Remote Control. - 2008. -Vol. 69(2). - P. 278-298.

7. ISKAKOV M., ISKAKOV A. Solution of the Hotelling's game in secure strategies // Economics Letters. - 2012. - Vol. 117. -P.115-118.

8. ISKAKOV M., ISKAKOV A. Equilibrium in secure strategies // CORE Discussion Paper 2012/61. Université catholique de Louvain, Center for Operations Research and Econometrics (CORE). - 2012. - 38 p.

9. ISKAKOV M., ISKAKOV A. Equilibrium in secure strategies -intuitive formulation // HSE Working Paper WP7/2012/06. -Moscow: Higher School of Economics, 2012. - 52 p.

10. ISKAKOV M., ISKAKOV A., and ZAKHAROV A. Equilibria in secure strategies in the Tullock contest // CORE Discussion Paper 2014/10. Université catholique de Louvain, Center for Operations Research and Econometrics (CORE). - 2014. - 26 p.

11. SANDOMIRSKAYA M. Weakening of the Nash equilibrium concept: the existence and applications to the Hotelling model [abstract of presentation]. - [Электронный ресурс]. - URL: http://ces.hse.ru/announcements/122400243.html (дата обращения: 07.09.2014).

12. STACKELBERG H. Marktform und Gleichgewicht. - Springer: Wien und Berlin, 1934. - 134 p.

EQUILIBIUM CONTAINED BY COUNTER-THREATS AND COMPLEX EQUILIBRIUM IN SECURE STRATEGIES

Mikhail Iskakov, Institute of Control Sciences of RAS, Moscow, Cand.Sc. (mih_iskakov@mail.ru).

Alexey Iskakov, Institute of Control Sciences of RAS, Moscow, Cand.Sc. (isk_alex@mail.ru, iskakov@ipu.ru).

Abstract: We present two generalizations of the concept of equilibrium in secure strategies. In equilibrium contained by counter-threats (ECCT) no player can increase his or her payoff by a unilateral deviation without creating a threat to lose more than he or she wins. We assume that this condition must be satisfied for any pseudo-equilibrium in the generalized sense, and, therefore, any such equilibrium must belong to the set of ECCT. The second generalization is the complex equilibrium in secure strategies. The proposed concept allows us identifying a hierarchical structure of mutual threats between players and will be useful for the analysis of problems with asymmetric behavior of the players. Search algorithms for proposed equilibria and their examples in the matrix games are provided.

Keywords: equilibrium in secure strategies, non-cooperative games, asymmetric behavior.

Статья представлена к публикации членом редакционной коллегии В.В. Мазаловым

Поступила в редакцию 21.08.2014.

Опубликована 30.09.2014.

i Надоели баннеры? Вы всегда можете отключить рекламу.