Равновесие в безопасных стратегиях

Искаков М.Б.

РАВНОВЕСИЕ В БЕЗОПАСНЫХ СТРАТЕГИЯХ

Искаков М.Б.

(Институт проблем управления РАН, Москва)

1. Введение

В статье исследуется взаимодействие многих участников, делящих между собой ресурс, расположенный на некотором множестве. Стратегией игрока является выбор точки на этом множестве, а его выигрышем - количество ресурса, расположенное в ближайшей окрестности выбранной точки. Такого рода задачи возникают в различных прикладных областях: при исследовании раздела рынка между фирмами, электората между партиями во время предвыборных кампаний и т.д. [1; 11]. Часто такие задачи решаются через конструирование механизмов и правил справедливого дележа и достижения компромисса [1; 3]. В статье рассматривается подход к решению проблемы через исследование игры участников, действующих рационально, независимо, без образования коалиций, соглашений и предварительных договоров об общих правилах.

При таком подходе обнаруживаются ситуации, при которых в игре не существует равновесия Нэша, но имеются интуитивно кажущиеся естественными равновесные состояния. Подобные ситуации, связанные с поиском понятия равновесия более широкого, чем равновесие Нэша, исследуются в [6; 7]. Главной особенностью предложенного равновесия в безопасных стратегиях является применение теории рефлексивности [5] для анализа структуры взаимных угроз, возникающих в играх с большим количеством участников. Данный подход применим к исследованию соревновательных систем стимулирования [4; 6; 9], где стратегии участников также определяются с учетом потенциальных угроз со стороны конкурентов.

2. Постановка задачи

Рассматривается следующая игра, являющаяся вариантом модели Даунса [1, с. 107-121; 10]. На отрезке [а, Ь] задана ограниченная, непрерывная, положительная функция Дх). Для игроков к е N = {1, ..., п} заданы их действия хк е [а, Ь] и значения выиг-

рышей Кк, определяемые следующим образом. При помощи индексов г е Ь = {1, ..., /}, I < п перенумеруем все стратегии игроков хг, причем каждой стратегии г могут соответствовать несколько игроков, если они выбрали одинаковую стратегию. Игроки (индексы к) нумеруются по возрастанию выбранных стратегий, так же, как и сами стратегии (индексы г). Такая двойная нумерация стратегий, привязанная к конкретной ситуации игры х =(хь ..., хп), не ограничивая общности дальнейших рассуждений, упростит их. Чтобы не путаться в такой двойной нумерации стратегий, введем для индексов при них различные обозначения: х^ - при рассмотрении просто стратегии г, хк - при рассмотрении стратегии игрока к, и хгк, когда нам важно выделить игрока к, выбравшего стратегию г.

Выигрыш Кк = Д, где ¡1 - количество игроков, выбравших стратегию хг, одновременно с игроком к.

Данная игра, как правило, не имеет равновесия по Нэшу даже в простейших случаях. Например, пусть количество игроков - 3, интегрируемая функция _Дх) ° 1, а = 0, й = 1. Тогда, если стратегии трех игроков совпадают, то любой из них может увеличить свой выигрыш с 1/3 до величины, сколь угодно близкой к ', или больше, незначительно отклонившись от общей стратегии. В противном случае существует игрок, стратегия которого не совпадает со стратегией любого другого игрока, и является наибольшей или наименьшей. Такой игрок может увеличить свой выигрыш, сдвигая свою стратегию от края отрезка, приближая ее к стратегиям других игроков.

Но при четном количестве игроков для постоянной функции равновесия Нэша существуют, например:

Требуется найти такое определение равновесия, которое удовлетворяло бы трем условиям: оно должно существовать для поставленной задачи в тех ситуациях, когда не существует равновесие Нэша; оно должно совпадать с равновесием Нэша там, где

(1)

х2к = х2к_1 = Ь + (а - Ь)(2к - 1)/п, к = 1, ..., п/2.

таковое существует; оно должно соответствовать интуитивным представлениям о рациональном поведении независимых, не договаривающихся между собой игроков.

3. Равновесие в безопасных стратегиях: определения

Введем понятие равновесия, более широкое, чем строгое равновесие Нэша, совпадающее с ним там, где оно существует, и позволяющее искать решения поставленной задачи. Сначала дадим общие определения, потом разъясним их на примерах. Пусть задана игра с множеством игроков 7 е N = {1, ..., п}, множеством действий х = (хь ..., хп) и значениями выигрышей К7(х). Зафиксируем игровую ситуацию х* = (х*ь ..., х*п).

Определение 1. Ситуация х* содержит угрозу игроку г со стороны игрока у, если $ х,: К,(х,, х*_}) > К,(х*) и К7(х,, х*_}) < К7(х*); при этом ситуация х* называется угрожаемой, а ситуация (х,, х*_;), так же, как и стратегия х,, - угрожающей игроку г со стороны игрока у.

Определение 2. Множеством предпочтительных выборов игрока г с учетом угроз относительно ситуации №гг(х*) называется множество стратегий х7: V х, К7(х7, х,, х*_,) > К7(х*).

Определение 3. Стратегия х*7 игрока 7 называется стратегией безопасной порядка 0 при заданной обстановке х*-г, если ситуация х* не содержит угроз игроку 7; множеством

2(0)(х*.г) обозначается совокупность всех стратегий х7, безопасных порядка 0, при заданной обстановке х*_7; множеством

У/0)(х*) называется множество Д(о:1(х*_г) и Щх*).

Комментарий. Множество 2 есть множество стратегий безопасных при заданной обстановке, а множество У - множество стратегий безопасных относительно игровой ситуации. Второе множество более широкое, так как включает такие отклонения от х*, которые сами по себе не являются безопасными, но все содержащиеся в них угрозы предпочтительней исходной ситуации. Различие двух множеств становится существенным, когда ситуация х* оказывается более проигрышной, чем все возможные угрозы.

Определение 4. Стратегия х*7 игрока 7 называется стратегией безопасной порядка т при заданной обстановке х*-г, если V, Ф 7: либо в ситуации х* игрок, не угрожает игроку 7, либо х*, е У(т1>(х*), т, < т, и любая угрожающая игроку 7

стратегия Xj £ Y/mj)(x*),

причем хотя бы для одного j выполняется вторая часть условия и mj = m— 1;

множеством Zfm\x*.i) обозначается совокупность всех стратегий Xj, безопасных порядка m, при заданной обстановке х*_;

множеством F/m)(x*) называется множество

Z/m)(x* j) и W(x*).

Комментарий. Это определение означает, что игрок, строящий свою безопасную порядка m стратегию, знает множества безопасности с меньшим порядком своих партнеров, и предполагает, что они не будут из них выходить.

Определение 5. Ситуация х* называется равновесием в безопасных стратегиях (РБС), если Vi, $ mj: x*j - безопасная порядка mj стратегия, и x*i е Arg max Kt (xt, x *_г. >; При этом РБС называ-

xieYi( mj >( x*>

ется простым, если все составляющие его стратегии имеют порядок безопасности 0, и сложным (m1? m2, ..., mn), если среди составляющих его стратегий {xi}, i е N, имеющих порядки безопасности mi, найдется хотя бы одна, для которой mi >0.

Комментарий. В РБС, сравнительно с равновесием Нэша (строгим), игроки также ищут ситуацию, от которой никому не было бы выгодно отклоняться, но на более узком множестве безопасных стратегий. То есть участники максимизируют свой выигрыш при соблюдении дополнительного требования «не подставляться» под угрозы со стороны партнеров.

Сформулируем простейшие утверждения, поясняющие введенную систему определений.

Утверждение 1. Строгое равновесие Нэша является РБС.

Доказательство. Если x* - строгое равновесие Нэша, то для V j, V xj #x*j Kj(xj, x*_j) < K;(x*). Это значит, что по Определению 1 все стратегии являются безопасными порядка О.^1

Утверждение 2. Если стратегия x*i - безопасная порядка m, при заданной обстановке x*-i, то $ x*i0, x*i1, ..., x*im_1 е x*-i - стратегии имеющие порядок безопасности соответственно 0, 1,., m - 1.

1 Здесь и далее символ «я» означает конец доказательства. 148

Доказательство. Если имеется х*7, безопасная порядка т стратегия, то, по Определению 2, должно существовать 7т_1 такое, что х*т-1 е 7г-т ^"^(х*). Применив Определение 2 к стратегии х*т-1 и так далее, получаем необходимость существования х*7т_2, ...,

х* х* ■ л л 70'

Замечание. Из последнего утверждения становится ясной структура РБС и способ его построения. Сначала ищутся безопасные стратегии нулевого порядка, существование которых необходимо для безопасных стратегий более высоких порядков, каждая из которых выстраивается на основе уже построенной стратегии предыдущего порядка безопасности.

4. Исследование задачи

4.1. ВОЗМОЖНЫЕ НЕРАВНОВЕСНЫЕ СИТУАЦИИ

Теперь, после введения и обсуждения понятия РБС, вернемся к рассмотрению задачи, для разъяснения тех трудностей, которые заставили ввести такое определение. Смысл игры заключается в том, что имеется некоторый ресурс, распределенный на отрезке в соответствии с Л(х), каждый игрок выбирает точку на этом отрезке, и функцией его выигрыша будет та доля ресурса, которая окажется в промежутке точек, ближайших к выбору этого игрока.

Рассмотрим возможные изменения стратегии участника игры, то есть ситуации, которые препятствуют существованию равновесия Нэша в данной игре. Пусть игрок к выбрал стратегию хк и решает, можно ли ее улучшить, выбрав новую стратегию х'к. Можно представить себе два случая. Может оказаться так, что новая стратегия получается из старой путем небольшого смещения х'к = хк + 8 или х'к = хк- 8. При этом она лежит в той же области, что и старая, ее положение относительно выборов других игроков и особых точек функции Л(х) (справа или слева) не изменится, границы интеграла целевой функции лишь слегка (на 5/2) сместятся. Назовем такое изменение стратегии «сдвиг». Новая стратегия также может быть выбрана в совершенно новой области отрезка [а, Ь] так, что интегрируемая область целевой функции окажется на новом месте, между другими игроками. Назовем такое изменение стратегии «скачок».

Введем обозначения. Пусть xik перенумерованы так, как указано при постановке задачи в разделе 2, то есть номер k относится к k-му игроку, ik - двойной индекс, обозначающий номер стратегии игрока k, причем как i, так и k упорядочены по возрастанию стратегий. Введем дополнительные обозначения.

J*Xi fXi

f (x)dx, i #1, K-1 = I f (x)dx,

(Xi_j +xi )/2 Ja

M xt + xi+1)/2 , fb

(2) I+i= | f (x)dx, i #n, K+n= | f (x)dx,

xi xi

Kmin = min Kk , Kmax = ШЯХ Kk.

1<k<n 1<k<n

Рассмотрим для xi возможные случаи, которые приводят к не-равновесности той или иной ситуации.

1) Если 2Kk< Kmax, то для игрока выгодно изменить стратегию скачком x'k = xmax, получив выигрыш V Kmax. Значит необходимое условие того, что ситуация будет равновесием: Kk < Kj, "k, j.

2) Если Kk < I+i, либо Kk < I i, то игроку выгодно изменить свою стратегию скачком x'k = xi + d (или x'k = xi - d), получив выигрыш K'k = I+ + e (или K'k = I i + e). Необходимое условие равновесия Kk > I+i, Kk > I-, "i, k.

3) Пусть игрок 1 (или n) - единственный игрок, выбравший стратегию x11 (или xln). Такому игроку выгодно изменить свою стратегию сдвигом x 1 = x1 + d, или x n = xn - d, увеличив свой выигрыш приблизительно на d/2 f((x1 + x2)/2) или d/2 f((xn_1 + xn)/2). Эта ситуация препятствует существованию равновесия Нэша для многих игр (смотри пример в разделе 2).

4) Если игрок k - единственный, выбравший стратегию xik, ik ф 1, ik ф l, и fXxk_1+xk)/2) Фf((xk+xk+1)/2), то игроку выгодно изменить стратегию сдвигом x k = xk - d или x'k = xk + d (в зависимости от того, где значение f(x) больше). При этом он увеличивает свой выигрыш приблизительно на d/2 \K(xii-1+xik)/2) -f((x!k+x!k+1)/2)|. При этом, даже если значения f(x) на границах области i-ой стратегии равны, то равновесие будет существовать, только если разность производных функции fx), взятых на левом и

правом концах этой области неотрицательна. Эта ситуация также приведет к отсутствию равновесий Нэша для многих игр (например для случая строго монотонной функции fx)).

5) Пусть xi = xik и эту же стратегию выбрал еще один игрок; если I+ i Ф Гik, то игроку выгодно изменить свою стратегию сдвигом, получив вместо VIi выигрыш max {I—e, I+— e}. Необходимое условие равновесия в этом случае

1+ ik = f ik.

6) Пусть, при выполнении необходимого условия из случая

5, выполняется дополнительное условие f((xik-1+xik)/2) ФfXxik+xik+0/2). Тогда игроку выгодно изменить свою стратегию сдвигом в сторону возрастания fx): xk = x 'k+d (или x ' k = xk-d), увеличив свой выигрыш приблизительно на d maxfXxik_1+x;k)/2), f((xik+xik+1)/2)}.

7) Пусть I+ ik = r,k, f((x1k-1+x1k)/2) Ф f((x1k+x1k+{)/2), и либо f((x,k-1+xik)/2) < 0, либо f((xik+xik+1)/2) > 0. Тогда игроку также выгодно сдвигаться в ту сторону, с которой выполняются соответствующие условия для производных.

8) Если xi = xik и эту же стратегию выбрало j > 1 игроков, то игроку выгодно изменить свою стратегию сдвигом, получив вместо 1/j+1 Iik выигрыш max {Iik-e, I+ik—e}. Значит равновесие невозможно в случае совпадения стратегий более чем двух игроков.

4.2. ПОСТРОЕНИЕ РБС

Рассмотрим случай, когда функция f(x) строго возрастает в начале отрезка [a, b], достигает максимума, после чего строго убывает. Обозначим m -номер стратегии i, в окрестности которой [(xm-1+xm)/2, (xm+xm+1)] функция f(x) достигает своего максимума, значение Km - определяется согласно (1), kmin е Argmink Kk, Kmin = min Kk . Исследуем поведение игрока k = 1. Пусть максимум

1 <k<n

f(x) находится не близко от краев отрезка a и b, то есть f(x) возрастает на всей области x1 и убывает на всей области xl. Из этого следует, что: во-первых, стратегию x1 может выбрать только один игрок, во-вторых, этому игроку будет выгодно сдвигать x 1 в сторону увеличения. Но если при этом окажется, что Г 1> Kmin, тогда игроку kmin станет выгодно перескочить в область игрока 1, поэтому игрок 1 будет сдвигаться вправо только до тех пор, пока для^ j

сдвигаться вправо только до тех пор, пока для х 1 выполняется неравенство Г1<Кт7п. А это условие означает для первого игрока выполнение Определения 1, то есть безопасную стратегию первого порядка. При этом стратегия первого игрока привязана к Кт7п, то есть к размеру самого маленького из выигрышей участников.

Теперь исследуем поведение игрока к со стратегией 7, 1 < 7 < т. ФункцияЛ(х) возрастает на всей области х7к, значит, игроку выгодно сдвигаться вправо, но игроку, находящемуся слева от него тоже выгодно сдвигаться вправо, в силу чего Определение 1 для рассматриваемого игрока не выполняется. Но если игрок, находящийся слева от рассматриваемого, имеет в своем стремлении сдвигаться вправо некоторый ограничитель (которым является

дополнительное условие Определения 2), и игрок к знает и учитывает это, то, опираясь на такое знание и на знание величины Кт7п, он может найти наилучшую для себя стратегию (наилучшую при условии, что ни он, ни другие игроки не выходят за пределы ограничения, заданного Определением 2). Из этого рассуждения путем рекурсии от игрока к к игроку 1 получается определение безопасной стратегии порядка к - 1 (в данном случае).

Для игроков 7, 7 > т, выбравших свои стратегии в области убывания Л(х), рассуждения аналогичны. Рассмотрим игрока (игроков), выбравшего стратегию т. Если этот игрок один, то, чтобы его стратегия была равновесной, необходимо выполнение следующего условия: ЛХхг-т-1+хг-т)/2) = _Д(хг-т+хг-т+1)/2). Если же их двое, то требуется другое условие: Г т = 1~7т, Лх-т) > Л((хгт-1+хгт)/2),

Л(хгт) >Л((хгт+хгт+1)/2). При этом в обоих случаях оказывается, что К7т =Кт7п, то есть игроки оказавшиеся на вершине, получают наименьший выигрыш из всех. Таким образом, мы доказали два утверждения, определяющие игровые ситуации являющиеся РБС, для случая однопиковых функций Л(х). Таким образом, доказаны следующие два утверждения.

Утверждение 3. Пусть Л(х) - достигает максимума внутри отрезка в точке хтах, строго возрастает при х< хтах, строго убывает при х> хтах. Тогда если:

хтах е [(хт-1+хт)/2, (хт+хт+1)/2]

1 ^2 — ^т—1 ^-т 1 т+1 — 1 п+1 1П

ЛЦх^+хтЩ) = _Д(хт+хт-ц)/2), то х* = (х1, ..., хп) - РБС.

Утверждение 4. Пусть fx) - достигает максимума внутри отрезка в точке xmax, строго возрастает при х < xmax, строго убывает при х > xmax. Тогда если:

xim xim+1 ,

xmax ^ [(xm—1+xm)/2, (xm+1+Xm+2)/2],

I 1 12 — 1 m—1 1-m !+ m+1 1 m+2 — 1 n+1 1 n ,

то X* = (xb xn) - РБС.

Теперь пусть fx) - постоянная функция. Игроки могут располагаться одиночно и парами xk = xk+1. Однозначно здесь определяются только стратегии игроков xi1 и xil, если они одиночны, из условия Г1 = I+1 = Kmin. Для остальных игроков, как одиночных, так и парных, требуется только выполнение Kk < 2Kj, " k, j. Для этой игры при n > 3 существуют равновесия Нэша: для этого крайние игроки должны быть парными x11 = x12, xlr-1 = xln, и должны выполняться указанные условия Kk< 2Kj. Доказано следующее.

Утверждение 5. Пусть fx) - постоянная функция.

Тогда, если X1 = X2, Xn-1 = Xn, и 2Kmin < Kmax, то X* = (X1, ..., Xn) -равновесие Нэша.

Если стратегия x1 единична и Г1 = Kmin, либо xn единична и

I+1 = Kmin, и Xmin не совпадает с X1 либо Xn;

2Kmin < Kmax,

то X* = (x1, ..., Xn) - РБС, не являющееся равновесием Нэша.

Рассмотрим случай строго возрастающей fx). При этом игрок, находящийся правее всех, будет стремится сместится влево, а игрок, находящийся слева от него - вправо, до тех пор, пока их стратегии не совпадут. При этом I+l = Г1 = I+1_1 = Kn = Kn_1 = Kmin. Доказано следующее.

Утверждение 6. Пусть fir) строго возрастает. Тогда если xn_

1 Xm и

Г1 = I 2 = — = Il-1 = Il = I+1 = Kmin,

то X* = (x1, ..., Xn) - РБС.

Объединим два предыдущих случая: пусть fx) сначала строго возрастает, потом достигает максимума и после этого становится константой. Доказано следующее.

Утверждение 7. Пусть f x) строго возрастает при х < xmax,

fx) f(xmax), при х — XmaX.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Тогда, еслиf((Xm-1+Xm)/2) <fXmax), f(Xm+Xm-n)/2) = fXmax), номер игрока с наименьшим выигрышем kmin > m,

11 ^2 • • • 1 т— 1 1 т Ктт £ Ктах,

то X* = (хь Хп) - РБС.

Пусть теперь Ах) достигает минимума внутри отрезка в точке хтп, строго убывает при х < хтп, строго возрастает при х > хШп. Рассмотрим игроков, примыкающих к точке минимума, так как ситуации всех других игроков этой игры уже рассмотрены выше. Два игрока, примыкающих к точке минимума будут стремиться сдвигаться друг от друга (в сторону возрастания функции), до тех пор, пока их стратегии не окажутся на границах множеств безопасности нулевого порядка. Доказано следующее.

Утверждение 8. Пусть Дх) достигает минимума внутри отрезка в точке хтп, строго убывает при х< хтп, строго возрастает при х> Хтп Тогда если

хтт ^ [(хт-1+хт)/2, (xm+1+Xm+2)/2],

А((Хт+Хт+1)/2) < _Д(Хт-1+Хт)/2),

Л(Хт+Х т+ 1)/2) <Д(х т+ 1+хт+2)/2Х

х1 x2, хп— 1 xn,

1+1 1+2 — 1 т—1 1 т 1 т+1 1т+2 — 1 п+1 1 т

то х* = (х1, ..., хп) - РБС.

В Утверждениях 4-9, для ряда типов функций Дх) (однопиковые, строго монотонные, константа и другие), сформулированы достаточные условия того, что игровые ситуации являются РБС. Построение наборов стратегий, удовлетворяющих этим достаточным условиям - самостоятельная задача, которую естественнее всего решать численно. Существование таких наборов достаточно очевидно следует из геометрических соображений, а единственность может выполняться не всегда: Утверждения 4 и 5 описывают два различных решения одной и той же задачи, а утверждение 6 задает широкое множество ситуаций РБС. Кроме того, в доказанных утверждениях мы описали поведение игроков, находящихся в различных положениях: крайний игрок в точке максимума, крайний игрок в точке минимума, крайний игрок при постоянной функции, игрок в области монотонности функции, игрок в области постоянства функции, игрок в области максимума, игрок в области минимума. Опираясь на этот результат, можно конструировать решение игры для различных Дх). Требуется преодоление двух возможных препятствий. Первое - наличие «мелких» минимумов, максимумов, областей возрастания и убывания, то есть если Дх)

ведет себя достаточно сложно и количество игроков не настолько велико, чтобы это компенсировать. Второе - определение количества игроков, приходящихся на каждый отрезок возрастания, убывания или постоянства Дх).

5. Заключительные замечания: сравнение с другими подходами и рефлексия в РБС

Сравним подход к решению игровых задач на основе безопасных стратегий с другими подходами. Как уже доказано выше, все строгие равновесия Нэша являются РБС, но нестрогие равновесия Нэша могут не быть РБС. Можно представить себе игру трех лиц с нестрогим равновесием Нэша и вообще без РБС. Пусть в этой игре из нестрогого равновесия может отклониться первый игрок, ничего не теряя, но нанося ущерб второму игроку. Из этого нового положения второй игрок может отклониться в третье положение, увеличивая свой выигрыш, не уменьшая выигрыш первого (то есть второе положение для первого игрока безопасно), но уменьшая выигрыш третьего. Из третьего положения третий игрок может отклониться, получив выигрыш и нанеся ущерб первому. Среди этих положений вообще нет безопасных стратегий, хотя нестрогое равновесие Нэша имеется. Таким образом, для случая нестрогого равновесия Нэша не удалось найти способ исследования при помощи РБС.

Сравним РБС с концепциями равновесий, более общих, чем равновесие Нэша, предлагавшихся другими авторами. В работах [7,

8] построена на основе введенной базовой системы равновесий последовательность ослабляющихся равновесий и итерационная схема поиска наисильнейшего из них для конкретных задач. При применении этой схемы, рассматриваемая задача (сформулированная в разделе 2) «попадает между» двумя соседними элементами построенной последовательности. Под более слабое определение А-равновесия попадает любой набор стратегий игроков (при введении условия строгой положительности Дх)), а для более сильного определения В-равновесий в данной игре не существует. Но так как базовая система является открытой, то она может быть дополнена РБС в качестве еще одного базового элемента.

Интересный подход к нахождению решения игры без равновесия Нэша, предложен в статье [6]. Построенный в статье алгоритм

исследования соревновательной системы стимулирования эквивалентен построению РБС для случая нулевого порядка безопасности.

Рассматриваемая игра - с фиксированной суммой выигрыша. Она не кооперативна, здесь не может использоваться концепция Парето-оптимальности. Эта игра также бескоалиционна. Все игроки действуют строго эгоистично и не договариваясь. Так что данное расширение понятия равновесия получено в духе традиционных нэшевских предположений о поведении игроков, только за счет введения простейшей стратегической рефлексии, достаточно естественной с точки зрения смысла игры. Этот смысл - каждый игрок преследует цель увеличения своего выигрыша до тех пор, пока не «подставляется» под угрозу со стороны любого другого игрока, и знает, что все другие игроки действуют таким же образом. При этом каждому игроку не трудно рассчитать (даже на чисто интуитивном уровне) области своей безопасности.

Исследование РБС основано не только на учете на учете угроз одному игроку со стороны других (простые безопасные стратегии), но и на учете этого учета угроз другими игроками (сложные безопасные стратегии). Этим метод поиска безопасных стратегий существенно отличается от подходов, стремящихся исключить рефлексию, таких, как метод гарантированного результата, или решение в смешанных стратегиях, и часто приводит к другим решениям.

Наиболее содержательным подходом кажется рассмотрение РБС с точки зрения рефлексивности [5]. В указанной книге, теоретические результаты сформулированы для произвольного числа игроков, но в качестве примеров рассматриваются в основном игры с небольшим количеством участников (два, три, несколько). В задачах с большим количеством игроков возникает особый вид стратегической рефлексии. С одной стороны, игроки, придерживающиеся РБС, используют рефлексию бесконечного ранга, как представления о способе построения стратегий партнерами, в рамках общего знания. С другой стороны, при построении конкретной стратегии с порядком безопасности т игрок учитывает область безопасных стратегий порядка т - 1 другого игрока, который учитывает БС порядка т - 2 третьего, и так далее, то есть использует рефлексивное рассуждение с рангом т. При этом ранг рефлексии второго вида должен быть меньше, чем число игроков.

При решении игры используется стратегическая рефлексия порядка не больше m - 1 (для случая строго монотонной функции решаемой в разделе 5 достигается уровень рефлексии m - 2). Определения 1,

2 и 3 задают структуру общего знания игроков о поведении друг друга.

Литература

1. АЛЕСКЕРОВ Ф.Т., ОРТЕШУК П. Выборы. Голосование. Партии. М.: «Академия», 1995, 208 с.

2. ВАСИЛЬЕВ Д.К., ЗАЛОЖНЕВ А.Ю., НОВИКОВ ДА., ЦВЕТКОВ А.В. Типовые решения в управлении проектами. М.: ИПУ РАН (научное издание), 2003, 73 с.

3. БРАМС С.Д., ТЕЙЛОР А.Д., Делим по справедливости, или гарантия выигрыша каждому. Серия «Экономика и бизнес». - М.: СИНТЕГ, 2002, 196 с.

4. НОВИКОВ ДА., ЦВЕТКОВ А.В. Механизмы стимулирования в многоэлементных организационных системах. М.: ООО «НИЦ «Апостроф»», 2000. - 182 с.

5. НОВИКОВ Д А., ЧХАРТИШВИЛИ А.Г. Рефлексивные игры. Серия «Управление организационными системами». - М.: СИНТЕГ, 2003, 160 с.

6. САНДАК Н.Н. Соревновательные системы. // Активные системы. Сборник статей № 2 (проблемы и методы управления в активных системах). - М. ИПУ.1974. с. 86-98.

7. СМОЛЬЯКОВ Э.Р. Расширенная базовая система равновесий и методика решения бескоалиционных игр. // Автоматика и телемеханика, № 11, 2001. с. 145-153.

8. СМОЛЬЯКОВ Э.Р. Эвристические процедуры поиска равновесий в бескоалиционных и антагонистических играх. // Автоматика и телемеханика, № 9, 1996. с. 18-28.

9. ЦЫГАНОВ В. В. Адаптивные механизмы в отраслевом управлении. - М.: Наука, 1991, 166 с.

10. DOWNS A. An Economic Theory of Democracy. - N.Y., Harper & Row, 1957.

11. MAS-COLLEL A., WHINSTON M.D., GREEN G.R. Microeconomic theory. N.Y.: Oxford Univ. Press, 1995. - 981 p.

Равновесие в безопасных стратегиях Текст научной статьи по специальности «Математика»

Похожие темы научных работ по математике , автор научной работы — Искаков М. Б.

Текст научной работы на тему «Равновесие в безопасных стратегиях»