Равновесия в угрозах и контругрозах в некооперативных играх

Искаков М.Б.

РАВНОВЕСИЯ В УГРОЗАХ И КОНТРУГРОЗАХ В НЕКООПЕРАТИВНЫХ ИГРАХ

Искаков М.Б.

(Институт проблем управления РАН, Москва) mih_iskakov@mail.ru

Исследуется взаимодействие многих участников, делящих между собой ресурс, расположенный на некотором множестве. Для формулируемой задачи в большинстве случаев не существует равновесия Нэша, но в то же время имеется интуитивно ощущаемое устойчивое рациональное поведение участников, основанное на рефлексивном учете взаимных угроз. Для описания такого поведения сформулировано определение равновесия в безопасных стратегиях (РБС), совпадающее со строгим равновесием Нэша там, где оно есть, и существующее для тех ситуаций в поставленной задаче, где оно отсутствует. При помощи введенного определения исследуется исходная задача. Приводится сравнение предлагаемого подхода с применявшимися разными авторами концепциями равновесия в угрозах и контругрозах для некооперативных играх.

Ключевые слова: некооперативные игры, равновесие в безопасных стратегиях, угрозы, контругрозы.

1. Введение

В статье, являющейся развитием работы [6], исследуется взаимодействие многих участников, делящих между собой ресурс, расположенный на некотором множестве. Стратегией игрока является выбор точки на этом множестве, а его выигрышем - количество ресурса, расположенное в ближайшей окрестности выбранной точки. Такого рода задачи возникают в различных прикладных областях: при исследовании раздела рынка между фирмами, электората между партиями во время предвыборных кампаний и т.д. [1, 15, 16]. Часто такие задачи решаются

через конструирование механизмов и правил справедливого дележа и достижения компромисса [1, 2]. В работе [12] исследуются постановки задач, сходных с задачей дележа ресурса, но сам ресурс определяется как континуальное множество игроков, выбирающих ту коалицию, к которой они присоединяются, применительно к моделям предвыборных кампаний. Здесь проблема решается через такое изменение постановки задачи, которое сделало бы ее доступной для анализа. В предлагаемой же статье рассматривается подход к решению проблемы через исследование игры конечного числа участников, действующих рационально, независимо, без образования коалиций, соглашений и предварительных договоров об общих правилах.

При таком подходе обнаруживаются ситуации, при которых в игре не существует равновесия Нэша, но имеются интуитивно кажущиеся естественными равновесные состояния. Подобные ситуации, связанные с поиском понятия равновесия более широкого, чем равновесие Нэша, исследуются в [9, 10]. Главная особенность предложенного равновесия в безопасных стратегиях применение теории рефлексивности [8] для анализа структуры взаимных угроз, возникающих в играх с большим количеством участников. Данный подход применим к исследованию соревновательных систем стимулирования [4, 7, 9, 13], где стратегии участников также определяются с учетом потенциальных угроз со стороны конкурентов.

2. Постановка задачи

Рассматривается следующая игра, являющаяся вариантом модели Даунса [1, с. 107-121, 15]. На отрезке [а, Ь] задана ограниченная непрерывная положительная функция / (х). Для игроков к е N = {1, ..., п} заданы их действия хк е [а, Ь]. Выигрыши игроков задаются следующим образом. Обозначим все несовпадающие стратегии, перенумерованные по возрастанию как у, ] е Ь = {1, ..., /}, I < п. При этом каждой стратегии ] могут соответствовать несколько игроков, если они выбрали одинаковое действие. Выигрыш стратегии определяется как:

(1) \ І1 = І1(а, Уі, У2) =Г^/{*)&,

•а

рЬ

Іі = Іі(Уі-і > Уі,Ь) = іу» + Уі /(х^х-

2

■ Уі + У 2

2

Выигрыш игрока к, хк = у, составляет Ск = І]/1], где і] - количество игроков, выбравших стратегию у, одновременно с игроком к. Таким образом, смысл игры заключается в том, что имеется некоторый ресурс, распределенный на отрезке в соответствии с Дх), каждый игрок выбирает точку на этом отрезке, и его целевой функцией будет то количество ресурса, которое окажется в промежутке точек, ближайших к точке выбора этого игрока.

Данная игра, как правило, не имеет равновесия по Нэшу даже в простейших случаях. Например, пусть количество игроков равно 3, интегрируемая функция _Дх) = 1. Тогда, если стратегии трех игроков совпадают, то любой из них может увеличить свой выигрыш с 1/3 до величины, сколь угодно близкой к ', или больше, незначительно отклонившись от общей стратегии. В противном случае существует игрок, действие которого не совпадает с действием ни одного из двух других игроков, и является наибольшей или наименьшей. Такой игрок может увеличить свой выигрыш, сдвигая свою стратегию от края отрезка и приближая ее к стратегиям других игроков.

Но если мы при тех же самых условиях рассмотрим любое четное количество игроков, то для такой игры равновесия Нэша существуют, например:

Заметим, что для постоянной функции А%) и количестве игроков большем трех, равновесия Нэша для этой игры существуют, общее решение задачи для такого частного случая будет сфор-

Х2к = Х2к-1 = Ь + (а - Ь)

2к -1

, к = 1,

п

2

мулировано в одном из дальнейших утверждений. Но если подынтегральная функция перестает быть константой и не является постоянной ни на одном интервале, то игра уже не имеет равновесия Нэша.

Требуется найти такое определение равновесия, которое удовлетворяло бы трем условиям: оно должно существовать для поставленной задачи в тех ситуациях, когда не существует равновесия Нэша; оно должно совпадать с равновесием Нэша там, где таковое существует; оно должно соответствовать интуитивным представлениям о рациональном поведении независимых, не договаривающихся между собой игроков.

3. Возможные неравновесные ситуации

Зафиксируем некоторый набор стратегий х = (х1, ..., хп) и рассмотрим возможные изменения стратегии участника игры, увеличивающие его выигрыш, т.е. ситуации, которые препятствуют существованию равновесия Нэша в данной игре. Пусть игрок к выбрал стратегию хк и решает, можно ли ее улучшить, выбрав новую стратегию х'к. Возможны два случая. Может оказаться так, что новая стратегия получается из старой путем небольшого смещения х'к = хк + д или х'к = хк- д. При этом она лежит в той же области, что и старая, ее положение относительно выборов других игроков и особых точек функции / (х) (справа или слева) не изменится, границы промежутка интегрирования целевой функции лишь слегка (на 5/ 2) сместятся. Назовем такое изменение стратегии «сдвигом». Новая стратегия также может быть выбрана в совершенно новом участке отрезка [а, Ь] так, что интегрируемая область целевой функции окажется на новом месте, между другими игроками. Назовем такое изменение стратегии «скачком».

Введем дополнительные обозначения, разделив выигрыши стратегий и области интегрирования I на две части, правую и левую:

I j (Уj -1, Уj) = fj-i+yj f (x)dx, j ф1 I (a, У1) = [* f (x)dx,

2

^yj + yj+i

I

4 (У1, У1+i) = f 2 f (x)dx, j Ф l,I+ (y,6) = [ f (x)dx.

Jyj Jyi

Cmin min Ck , Cmax max Ck ,

1<k<n 1<k<n

I max = max I j , I+max = max I , .

1<j<l J 1<j<l J

Рассмотрим для xk = yj возможные случаи, которые приводят к неравновесности той или иной ситуации. Существенными параметрами ситуации являются следующие:

1. Количество игроков, выбравших стратегии, совпадающие

с xk;

2. Расположение yj относительно других стратегий, лежит ли данный выбор между двумя другими или примыкает к краю отрезка [а, 6].

3. Значения функции f (x) и ее производной на краях области интегрирования Ij;

4. Сравнительная величина правой и левой подобластей отрезка I-j и I j

5. Сравнительное значение выигрыша игрока Ck и величин

Сmax, I max и I max*

Теперь можно перечислить возможные неравновесные ситуации:

1. Если игрок k - единственный, выбравший стратегию y1 или yl, то такому игроку выгодно изменить свою стратегию сдвигом x'k = y1 + 8, или x'k=yl - 8, увеличив свой выигрыш

8 J У1 + У 2 ^ 8 J yl-1 + yl

приблизительно на — f I ^—- I или на — f I----------2----

2. Если игрок к - единственный, выбравший стратегию у,

, то игроку выгодно

( у.,-1 + yj V / yj + yj+1 ^

j * {1, l}, и f Ф f

2

изменить стратегию сдвигом х'к=у- - д, или х'к=у- + д (в зависимости от того где значение_Дх) больше). При этом он увеличива-

151

ет свой

5

2

/

( У]-1 + У] ^

V

2

- /

выигрыш

( У] + У]+1 ^

приблизительно

на

/

2

3. Игрок к - единственный, выбравший у,

/

( У]-1 + У] ^ 2

= /

У] + У+1 2

/'

У]-1 + У] 2

- /'

( У] + У]+1 ^ 2

> 0.

При сдвиге на д выигрыш увеличивается приблизительно на

( ( /'

V V

У]-1 + У]

2

- /'

V /у

4. Стратегию у- = хк выбрал еще один игрок, тогда при I-- фI +- игроку выгодно изменить стратегию сдвигом в сторону

большей подобласти, получив вместо выигрыш

тах{1- -е, I- -е].

5. Стратегию у- = хк выбрал еще один игрок, I= I +-, и вы-хотя бы одно из двух неравенств

полняется

/

( У]-1 + У]л 2

( У] + У]+1 ^ 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

> /(У,-). При сдвиге на

д выигрыш игрока увеличится приблизительно на

5(/ Ум + У]}

\

/

V V

2

или на

((

/

V V

У] + У]+1 2

6. Стратегию у- = хк выбрал еще один игрок, I - = I+

/

У]-1 + У]

=/

У] + У]+1 2

= /(У і), и выполняется хотя бы

одно из двух неравенств /'

( У]-1 + У]л

< /'(У]) или

/' 152

( У] + У]+1 ^

> / (У /). При сдвиге на д выигрыш игрока увели-

2

чится приблизительно на

f bi)— f

/у

или на

5L

4

f f f'

V v

у, + y,+i

2

- f'(У,)

7. Если стратегию у- = хк, кроме игрока к, выбрали два или более других игроков, то любому из них выгодно изменить свою стратегию сдвигом, получив вместо I - /1- выигрыш

max{I1 — s, I + — s}. То есть равновесие невозможно при совпадении стратегий более чем трех игроков.

8. Если выполняется хотя бы одно из трех неравенств

2 Ck < Cmax или Ck < I~max или Ck < I +max, то игроку выгодно изменить свою стратегию скачком x'k = xmax или x'k = у max - s или x'k = у max + s, получив выигрыш Cmax /2 или I max - s или I+max - s соответственно.

Приведенный перечень неравновесных ситуаций дает наглядное представление о тех препятствиях, которые требуется преодолеть, чтобы решить задачу теоретически. С другой стороны, при разрешении подобных задач на практике, участники взаимодействия обычно интуитивно находят стратегии дележа того или иного ресурса, даже не договариваясь между собой. Попробуем качественно промоделировать поведение субъектов, которое позволяет им преодолевать тенденцию к неустойчивости.

Рассмотрим игрока k, находящегося в неравновесной ситуации 1, единственный игрок, выбравший стратегию xk = у1. Пусть его сосед справа находится достаточно далеко, так что игрок имеет возможность двигать свою стратегию x'k от края отрезка. При этом отрезок [a, x'k] все больше увеличивается и соответствующая ему часть выигрыша I'-1 растет. Если среди других игроков найдется такой, что его выигрыш станет меньше величины I'-1, то возникнет угроза скачка этого игрока в область [a, x'k], принадлежащую игроку k. Эта угроза должна сдерживать

2

стремление к росту значения х'к, ограничивать этот параметр так, чтобы выполнялось условие I' 1 < Стт.

Теперь перейдем к строгому формулированию подхода, позволяющего промоделировать замеченную логику поведения субъектов.

4. Равновесие в безопасных стратегиях: определения

Введем понятие равновесия, более широкое, чем строгое равновесие Нэша (определение строгого равновесия Нэша см. в приложении), совпадающее с ним там, где оно существует, и позволяющее искать решения поставленной задачи. Сначала дадим общие определения, потом разъясним их на примерах. Пусть задана игра с множеством игроков 1 е N = {1, ..., п}, множеством действий х = (х1, ..., хп), хI е X, и значениями выигрышей К(х).

Определение 1. Угрозой игроку 1 со стороны игрока - называется пара ситуаций {х-, (х-, х-)}1 такая, что К-(х-, х_ -) > К(х) и К(х-, х-) < К(х). При этом ситуация х называется содержащей угрозу, ситуация (х-, х_Д так же, как и стратегия х_- называются угрожающими игроку 1 со стороны игрока -.

Определение 2. Множеством Ж^(х) предпочтительных выборов ¡-го игрока с учетом угроз относительно ситуации х называется множество его стратегий х'1 таких, что для любого игрока - и любой его стратегии х- выполнено К1(х'„ х-, х-г]) > К(х).

Определение 3. Стратегия х1 игрока 1 называется стратегией безопасной порядка 0, или простой безопасной стратегией, при заданной обстановке х-1, если ситуация х не содержит угроз игроку 1. Множество таких стратегий называется множеством простых безопасных стратегий для игрока 1

1 Обозначение (х-, х- = (хь х--1, х-, х-+1, хп).

при окружении х-1 и обозначается 2^° (х-г). Множеством простых безопасных стратегий для игрока 1 относительно ситуации х называется множество 2^° (х*-г) и Щх*), которое обозначается как У/0) (х*).

Комментарий. Множество Z есть множество стратегий безопасных при заданной обстановке, а множество У - множество стратегий, безопасных относительно игровой ситуации. Второе множество более широкое, так как включает такие отклонения от х, которые сами по себе не являются безопасными, но все содержащиеся в них угрозы предпочтительней исходной ситуации. Различие двух множеств становится существенным, когда ситуация х оказывается более проигрышной, чем все возможные угрозы.

Определение 4. Стратегия х1 игрока 1 называется стратегией безопасной порядка т при заданной обстановке х-1, если V- выполняется хотя бы одно из двух условий:

1. либо в ситуации х игрок - не угрожает игроку 1,

2. либо х- е У-™- (х), т- < т, и любая угрожающая игроку 1 стратегия х- £ У-™- (х), причем хотя бы для одного -выполняется вторая часть условия и т- = т - 1.

Множество таких стратегий называется множеством безопасных порядка т для игрока 1 стратегий при заданной обстановке х-1 и обозначается Д(т) (х-г). Множеством безопасных порядка т стратегий относительно ситуации х называется множество Д(т) (х-г) и Щх), которое обозначается как У(т) (х).

Комментарий. Это определение означает, что игрок, строящий свою безопасную порядка т стратегию, знает множества безопасности с меньшим порядком своих партнеров, и предполагает, что они не будут из них выходить. Следует отметить, что определение имеет рекурсивный характер, то есть безопасные стратегии порядка т определяются через безопасные стратегии порядка т - 1.

Определение 5. Ситуация х* называется равновесием в безопасных стратегиях (РБС), если V! 3 т{. х* - безопасная

порядка mi стратегия, и x*i е arg maxKt (xt, x *_i ). При этом

XjEY/m )(X*)

РБС называется простым, если все составляющие его стратегии имеют порядок безопасности 0, и сложным (mi, m2, ..., mn), если среди составляющих его стратегий {xi}, i е N, имеющих порядки безопасности mi, найдется хотя бы одна, для которой mi > 0.

Комментарий. В РБС, сравнительно со строгим равновесием Нэша, игроки также ищут ситуацию, от которой никому не было бы выгодно отклоняться, но на более узком множестве безопасных стратегий, т.е. участники максимизируют свой выигрыш при соблюдении дополнительного требования «не подставляться» под угрозы со стороны партнеров.

Сформулируем простейшие утверждения, поясняющие введенную систему определений.

Утверждение 1. Строгое равновесие Нэша является

РБС.

Доказательство. Если х* - строгое равновесие Нэша, то для V j, V Xj Фx*j Kj(Xj, х*-3) < Kj(x*). Это значит, что по определению 1 все стратегии являются безопасными порядка 0. ■'

Утверждение 2. Если стратегия xi - безопасная порядка m при заданной обстановке x-i, то 3 xi0, xi1, ..., xi— е x-i -стратегии, имеющие порядок безопасности соответственно 0, 1,..., m - 1.

Доказательство. Если имеется xi, безопасная порядка m стратегия, то по определению 2 должно существовать im-1 такое, что xim-1 е Yim-1(m-1)(x). Применив определение 2 к стратегии xim1 и так далее, получаем необходимость существования xim ..., xi 1, xi0. ■

Замечание. Из последнего утверждения становится ясной структура РБС и способ его построения. Сначала ищутся безо-

1 Здесь и далее символ «я» означает конец примера или доказательства.

156

пасные стратегии нулевого порядка, существование которых необходимо для безопасных стратегий более высоких порядков, каждая из которых выстраивается на основе уже построенной стратегии предыдущего порядка безопасности.

5. Исследование задачи

Теперь вернемся к рассмотрению задачи и построению для нее решения в виде РБС. Напомним, что смысл игры заключается в том, что имеется некоторый ресурс, распределенный на отрезке в соответствии с fx), каждый игрок выбирает точку на этом отрезке и функцией его выигрыша будет та доля ресурса, которая окажется в промежутке точек, ближайших к выбору этого игрока.

Рассмотрим случай, когда функция f (x) строго возрастает в начале отрезка [a, b], достигает максимума, после чего строго убывает (однопиковая функция). Обозначим через m номер

У т-1 + Ут Ут + У m+1 _ 2 ’ 2 _ функция f (x) достигает своего максимума, а kmin - номер игрока с минимальным выигрышем, kmm е arg min Ск. Исследуем

1<к <П

поведение игрока 1 с наименьшей стратегией, x1 = y1. Пусть максимум f (x) находится не близко от краев отрезка a и b, т.е. f (x) возрастает на всей области интегрирования I1 и убывает на всей области интегрирования I/. Из этого следует, что, во-первых, стратегию У1 может выбрать только один игрок (смотри условие 5 в разделе 3) и, во-вторых, этому игроку будет выгодно сдвигать x'1 = y'1 в сторону увеличения. Но, если при этом окажется, что I-1 > Cmin, тогда игроку kmin станет выгодно перескочить в область игрока 1, поэтому игрок 1 будет сдвигаться вправо только до тех пор, пока для y'1 выполняется неравенство I -1 < Cmin. А это условие означает для первого игрока выполнение определения 1, то есть безопасную стратегию первого порядка.

стратегии ym, в окрестности которой

При этом стратегия первого игрока привязана к Стт, то есть к размеру самого маленького из выигрышей участников.

Теперь исследуем поведение игрока к со стратегией у, 1 <у < т. Функция Дх) возрастает на всей области у, значит, данному игроку выгодно сдвигаться вправо, в направлении возрастания функции, но игроку, находящемуся слева от него тоже выгодно сдвигаться вправо, что создает угрозу игроку к, в силу чего определение 1 для рассматриваемого игрока не выполняется. Но, если игрок, находящийся слева от рассматриваемого, стремящийся сдвигаться вправо, имеет в своем движении некоторый ограничитель (которым является второе условие определения 4), и игрок к знает и учитывает это, то, опираясь на такое знание и на знание величины Стт, он может найти наилучшую для себя стратегию (наилучшую при условии, что ни он, ни другие игроки не выходят за пределы ограничения, заданного определением 4). Из этого рассуждения путем рекурсии по номерам стратегий у, у - 1, ..., 1 от игрока к к игроку 1 получается определение безопасной стратегии порядка у - 1 (в данном случае).

Для игроков со стратегиями у > т, располагающимися в области убывания Д(х), рассуждения аналогичны. Рассмотрим игрока (игроков), выбравшего стратегию т. Если этот игрок один, то, чтобы его стратегия была равновесной, необходимо

выполнение условия Д^Ут-!__Ут^ = Д^Ут 2Ут+1 ^ . При этом

количество игроков совпадает с количеством различных стратегий, п = I. Если же таких игроков двое, то требуется другое условие: I +т = I т,

Д(Ут ) > Д[ Ут-12_ Ут ), Д(Ут ) = Д[ Ут _2~Ут_1 ) . В обоих случаях

оказывается, что игрок кт, выбравший стратегию т и оказавшийся на вершине, получает наименьший выигрыш из всех: Ст =Стт. Таким образом, мы доказали два утверждения, определяющие игровые ситуации, являющиеся РБС, для случая однопиковых функций Д (х). Построение РБС изображено на рис. 1 и

158

2.1 Таким образом, доказаны два следующие утверждения, определяющие игровые ситуации, являющиеся РБС, для однопиковых Д(х).

Утверждение 3. Пусть Д(х) достигает максимума внутри отрезка в точке хтах, строго возрастает при х < хтах, строго убывает при х > хтах. Тогда если:

У т-1 _ Ут Ут _ У т_1

2

11 12 1т-1 1т 1 т_1

Д^Ут-21т^ = Д^Ут _Ут_1'

I = п,

х%' = Ур У = I ■■■> I,

(к1, к/) - перестановка (1, ■

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

то х* = (х1, ..., хп) - РБС.

п),

1 Обозначение: хку = уу , стратегия игрока ку, выбравшего стратегию у.

159

условий утверждения 3

условий утверждения 4

Утверждение 4. Пусть Д(х) - достигает максимума внутри отрезка в точке хтах, строго возрастает при х < хтах и строго убывает при х > хтах. Тогда если:

У т-1 _ Ут Ут _ У т_1

2 2

А = 12 = ^т-1 = ^ т = ^ т =

I = п - 1,

х*к1 = У],]

_

т_1

= I _ = I _ = С ■■■ 11 -1 11

1, т - 1, т + 1, I,

Y*if = x*i" = V

л k m л k m jm>

(k\, km-1, k'm, k"m, km+\, k{) - перестановка (1, n),

то x* = (xb xn) - РБС.

Рассмотрим случай строго возрастающей f (x). При этом игрок, находящийся правее всех, будет стремиться сместиться влево, а игрок, находящийся слева от него, - вправо до тех пор, пока их стратегии не совпадут. При этом I l = I — =

I +l-1 = Cn = Cn-1 = Cmin. Иллюстрация к построению дана на рис.

3. Доказано следующее утверждение.

Утверждение 5. Пусть f (x) строго возрастает. Тогда если:

I “= I “= = I- = I “= I += C

II ■|2 1l-1 1l 1l min ’

l = n - 1,

x*kj = Vj> j = 1> ■■■’ l - 1 x*k'i = x*k''i = Vi,

(kb kl-1, k'i, k"l) - перестановка (1, n),

то x* = (x1, ..., xn) - РБС.

В утверждениях, для некоторых типов функций f (x) (одно-

условий утверждения 6

пиковые, строго монотонные) сформулированы достаточные условия того, что игровые ситуации являются РБС. Построение наборов стратегий, удовлетворяющих этим достаточным условиям - самостоятельная задача, которую естественнее всего

решать численно. Существование таких наборов достаточно очевидно следует из геометрических соображений, а единственность может выполняться не всегда: утверждения 3 и 4 описывают два различных решения одной и той же задачи. Кроме того, в доказанных утверждениях описано поведение игроков, находящихся в различных положениях: крайний игрок в точке максимума, крайний игрок в точке минимума, крайний игрок при постоянной функции, игрок в области монотонности функции, игрок в области постоянства функции, игрок в области максимума, игрок в области минимума. Опираясь на этот результат, можно конструировать решение игры для различных Д (х). Потребуется преодоление двух возможных препятствий. Первое -наличие «мелких» минимумов, максимумов, областей возрастания и убывания, т. е. если Д (х) ведет себя достаточно сложно и количество игроков не настолько велико, чтобы это компенсировать. Второе - определение количества игроков, приходящихся на каждый отрезок возрастания, убывания или постоянства

Д (х).

6. Сравнение с другими подходами и рефлексия в РБС

Как показано выше, все строгие равновесия Нэша являются РБС, но нестрогие равновесия Нэша могут не быть РБС.

Сравним РБС с концепциями равновесий, более общих, чем равновесие Нэша, предлагавшихся другими авторами. В [10, 11] построена на основе введенной базовой системы равновесий последовательность ослабляющихся равновесий и итерационная схема поиска наисильнейшего из них для конкретных задач. При применении этой схемы рассматриваемая задача (сформулированная в разделе 2) «попадает между» двумя соседними элементами построенной последовательности. Под более слабое определение А-равновесия попадает любой набор стратегий игроков (при введении условия строгой положительности Д (х)), а для более сильного определения В-равновесий в данной игре не существует. Но так как базовая система является открытой, то

она может быть дополнена РБС в качестве еще одного базового элемента.

Интересный подход к нахождению решения игры без равновесия Нэша, предложен в [9]. Построенный в статье алгоритм исследования соревновательной системы стимулирования эквивалентен построению РБС для случая нулевого порядка безопасности.

Рассматриваемая игра - с фиксированной суммой выигрыша, некооперативная и бескоалиционная. Все игроки действуют строго эгоистично и не договариваясь. Так что данное расширение понятия равновесия получено в духе традиционных некооперативных предположений о поведении игроков, только за счет введения простейшей стратегической рефлексии, достаточно естественной с точки зрения смысла игры. Этот смысл - каждый игрок преследует цель увеличения своего выигрыша до тех пор, пока не «подставляется» под угрозу со стороны любого другого игрока, и знает, что все другие игроки действуют таким же образом. При этом каждому игроку не трудно рассчитать (даже на чисто интуитивном уровне) области своей безопасности.

Исследование РБС основано не только на учете угроз одному игроку со стороны других (простые безопасные стратегии), но и на учете этого учета угроз другими игроками (сложные безопасные стратегии). Этим метод поиска безопасных стратегий существенно отличается от подходов, стремящихся исключить рефлексию, таких как метод гарантированного результата или решение в смешанных стратегиях, и часто приводит к другим решениям.

Наиболее близкий к понятию РБС подход в теории игр -концепция решения в угрозах и контругрозах, применяющаяся для анализа кооперативных игр. Впервые этот подход и термин был применен в работе [14] для анализа устойчивости коалиционных конфигураций. Позже предлагались и другие определения решения. Более подробно следует рассмотреть лишь те из них, которые в модифицированном виде могут быть применены к некооперативным играм и к случаю отсутствия коалиций. Такими подходами являются стратегии угроз и контругроз,

описанные в [3], и К-решения [5]. Приведем развернутое сравнение РБС с альтернативными концепциями, применительно к задаче дележа ресурса распределенного на отрезке.

1. В РБС рассматриваются не коалиции, а отдельные игроки. Это ограничение сильно упрощает анализ. Построить конструкцию, аналогичную РБС для коалиционного взаимодействия пока представляется затруднительным. Поэтому сравнивать различные подходы возможно только рассматривая коалиции, состоящие из единственного игрока.

2. В РБС угрозы и контругрозы рассматриваются только относительно фиксированной игровой ситуации, стратегий окружения игроков, осуществляющих угрозу и контругрозу (и контр-...контругрозу), в то время, в то время как в альтернативных подходах применяется намного более сильное требование превосходства выигрыша угрожающего игрока при любом окружении. В задаче дележа ресурса на отрезке такой подход неприменим, так как среди всевозможных окружений всегда можно найти такие наборы стратегий, которые сводят выигрыш любого (в том числе и угрожающего) игрока к сколь угодно малой величине (например если у двух соседних с к игроков берутся стратегии х - 3, х + 3). Это означает, что никаких угроз для решаемой задачи при альтернативных подходах не может существовать вообще и, чтобы они появились, необходимо сильно ослабить условия определения угрозы, путем введения требования постоянства окружения.

3. Главное отличие предлагаемого подхода - рекурсивное определение, позволяющее анализировать цепочки угроз. Другие подходы, оперирующие связкой «угроза - контругроза» не могут выявить этой сложной структуры отношений участников игры. При применении простого определения угрозы и контругрозы к задаче дележа ресурса получается, что контругроза к любой угрозе более чем второго порядка блокируется контрконтругрозой и, таким образом, перестает быть действительной, что останавливает дальнейший анализ.

4. Менее значимое отличие при определении угрозы [5] заключается в том, что она определяется не как угроза игроку

(коалиции) со стороны другого игрока (коалиции), а как угроза игровой ситуации со стороны коалиции (игрока).

Наиболее содержательным подходом кажется рассмотрение РБС с точки зрения теории рефлексивности, описанной в [8]. Там теоретические результаты сформулированы для произвольного числа игроков, но в качестве примеров рассматриваются в основном игры с небольшим количеством участников (два, три, несколько). В задачах с большим количеством игроков возникает особый вид стратегической рефлексии. С одной стороны, игроки, придерживающиеся РБС, используют рефлексию бесконечного ранга, как представления о способе построения стратегий партнерами в рамках общего знания. С другой стороны, при построении конкретной стратегии с порядком безопасности т игрок учитывает область безопасных стратегий порядка т - 1 другого игрока, который учитывает безопасные стратегии порядка т - 2 третьего, и так далее, т.е. использует рефлексивное рассуждение с рангом т. При этом ранг рефлексии второго вида должен быть меньше, чем число игроков. При решении игры используется стратегическая рефлексия порядка не больше т - 1 (для случая строго монотонной функции достигается уровень рефлексии т - 2). Определения 1, 2 и 3 задают структуру общего знания игроков о поведении друг друга.

Литература

1. АЛЕСКЕРОВ Ф.Т., ОРТЕШУК П. Выборы. Голосование. Партии. М.: Академия, 1995.

2. БРАМС С.Д., ТЕЙЛОР А.Д. Делим по справедливости, или гарантия выигрыша каждому. Серия «Экономика и бизнес». М.: СИНТЕГ, 2002.

3. ВАЙСБОРД Э.М., ЖУКОВСКИЙ В.И. Введение в дифференциальные игры нескольких лиц и их приложения. - М.: Советское радио, 1980. - 304 с.

4. ВАСИЛЬЕВ Д.К., ЗАЛОЖНЕВ А.Ю., НОВИКОВ Д А., ЦВЕТКОВ А.В. Типовые решения в управлении проектами. М.: ИПУ РАН (научн. изд.), 2003.

5. ВИЛКАС Э.Й. Оптимальность в играх и решениях. - М.:

Наука. Гл. ред. Физ.-мат. Лит., 1990. - 256 с.

6. ИСКАКОВ М.Б. Равновесие в безопасных стратегиях. / / Автоматика и телемеханика. 2005. №3. С. 139-153.

7. НОВИКОВ Д А., ЦВЕТКОВ А.В. Механизмы стимулирования в многоэлементных организационных системах. М.: ООО НИЦ «Апостроф», 2000.

8. НОВИКОВ ДА., ЧХАРТИШВИЛИ А.Г. Рефлексивные игры. Серия «Управление организационными системами». М.: СИНТЕГ, 2003.

9. САНДАК Н.Н. Соревновательные системы // Активные системы. Сб. ст. № 2 (проблемы и методы управления в активных системах). М.: ИпУ, 1974. С. 86-98.

10. СМОЛЬЯКОВ Э.Р. Расширенная базовая система равновесий и методика решения бескоалиционных игр // АиТ. 2001. № 11.С. 145-153.

11. СМОЛЬЯКОВ Э.Р. Эвристические процедуры поиска равновесий в бескоалиционных и антагонистических играх. // Автоматика и телемеханика, № 9, 1996. с. 18-28.

12. СОСИНА Ю.В. Энодогенное формирование политических структур и исследование их устойчивости, Препринт WP7/2004/04, М.:ГУ ВШЭ, 2004.

13. ЦЫГАНОВ В.В. Адаптивные механизмы в отраслевом управлении. - М.: Наука, 1991, 166 с.

14. AUMANN R.J., MASCHLER M. The bargaining set for cooperative games // Advances in game theory, Ann. Math. Studies. V. 52. - Princeton: Princeton Univ. Press, 1964. - P. 443-476.

15. DOWNS A. An Economic Theory of Democracy. N.Y.: Harper & Row, 1957.

16. MAS-COLLEL A., WHINSTON M.D., GREEN G.R. Microeconomic theory. N.Y.: Oxford Univ. Press, 1995.

Равновесия в угрозах и контругрозах в некооперативных играх Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Искаков М. Б.

Похожие темы научных работ по математике , автор научной работы — Искаков М. Б.

Текст научной работы на тему «Равновесия в угрозах и контругрозах в некооперативных играх»