УДК 517.83
А.В. Райгородская1
К ВЫБОРУ РАВНОВЕСНОГО ПОВЕДЕНИЯ В БЕСКОНЕЧНОЙ ПОВТОРЯЮЩЕЙСЯ ИГРЕ РАЗМЕРНОСТИ 2 х 2: СЛУЧАЙ ИГРОКОВ-КОНСЕРВАТОРОВ И ИГРОКОВ-ИННОВАТОРОВ
Изучается бесконечная повторяющаяся 2x2 игра, в которой каждый игрок в каждом последующем раунде назначает свою чистую стратегию, основываясь на результате случайного эксперимента; последний генерируется произвольной смешанной стратегией игрока, которая с большой, но, вообще говоря, отличной от 1 вероятностью предписывает этому игроку выбор стратегии, соответствующей его типу поведения: консервативному или инновационному. Игра анализируется для всевозможных случаев взаимодействия игроков-консерваторов и игроков-инноваторов.
Ключевые слова: биматричные игры, равновесие, бесконечные повторяющиеся игры.
1. Введение. В теории повторяющихся (эволюционных) игр, изучающей модели принятия рациональных решений в процессах многократного взаимодействия игроков (см., например, [1-7]), сравнение различных режимов взаимодействия производится, как правило, с позиции динамических систем: оценивается, каким образом столкновение различных поведенческих стратегий влияет на последовательность принимаемых решений. Основы теоретико-игрового подхода к анализу альтернативных способов принятия решений были заложены в [8], где введены в рассмотрение игры на классах ограниченно рациональных поведенческих стратегий игроков и определено понятие равновесных наборов поведенческих стратегий. Подход к оптимизации траекторий повторяющихся игр на классах поведенческих стратегий игроков, основанный на методах математической теории управления, был предложен в [9].
Данная работа следует в русле подхода [8]. Происходит расширение стандартных поведений игроков и выбор наилучшего (равновесного) в расширенных классах поведений. Рассматривается повторяющаяся биматричная игра размерности 2 х 2, в которой выбор стратегии каждым игроком в каждом последующем раунде диктуется типом поведения игрока: консервативным или инновационным. Отправной моделью служит, таким образом, повторяющаяся игра, в которой данное правило принятия решений применяется без каких-либо отклонений. Затем классы поведенческих стратегий игроков расширяются: каждому игроку разрешается принимать решение о выборе своей чистой стратегии на следующем раунде, основываясь на результате случайного эксперимента. Последний генерируется произвольной смешанной стратегией игрока, которая предписывает большую, но, вообще говоря, отличную от 1 вероятность чистым стратегиям, соответствующим типам поведения игроков. Такие поведенческие стратегии игроков названы в работе функциями е-релаксированного выбора.
В п. 2 вводится в рассмотрение стохастическая игра на классах функций е-релаксированного выбора (е-релаксированная бесконечная повторяющаяся игра), выигрышами игроков выступают математические ожидания их средних выигрышей, получаемых на протяжении всех раундов. В п. 3 рассматривается и находится выигрыш в бесконечной е-релаксированной игре для различных поведений игроков. В п. 4 игра исследуется для случая двух консерваторов. Также приводятся результаты игры двух инноваторов и игры консерватора и инноватора.
2. Бесконечная е-релаксированная повторяющаяся игра с двумя типами поведения.
Рассмотрим биматричную игру размерности 2 х 2 с матрицами выигрышей А = (0^)1^=1,2 и В = = (bij)i,j=1,2 соответственно первого и второго игроков. Строки матриц выигрыша соответствуют номерам чистых стратегий первого игрока, столбцы — номерам стратегий второго игрока. Под смешанной стратегией первого игрока понимаем, как обычно, произвольное вероятностное распределение (а, 1 — а) на множестве стратегий этого игрока; здесь а — вероятность выбора игроком своей чистой стратегии 1, а 1 — а — вероятность выбора игроком своей чистой стратегии 2. Смешанную стратегию
1 Факультет ВМК МГУ, асп., e-mail: asik.vmkQgmail.com
(а, 1 — а) отождествляем с ее первой компонентой а € [0,1]. Аналогично смешанную стратегию второго игрока отождествляем с числом ¡3 € [0,1]. Всякая пара (а, (3) естественным образом превращает множество всех пар чистых стратегий игроков в вероятностное пространство, а выигрыши игроков — в случайные величины на этом вероятностном пространстве; их математические ожидания трактуются как выигрыши игроков, отвечающие паре (а,/3).
Будем для определенности предполагать, что в рассматриваемой биматричной игре не существует точек равновесия по Нэшу с компонентами в чистых стратегиях. Тогда, в соответствии с известной классификацией 2 х 2-игр (см. [10]), в данной игре существует единственная точка равновесия по Нэшу в смешанных стратегиях; при этом, согласно [10], не нарушая общности (при необходимости изменяя нумерацию игроков), можно считать, что
¿>12 > ¿>11, ¿>21 > ¿>22, Й11 > Й21, Й22 > 012- (1)
Таким образом, предполагаем, что неравенства (1) имеют место.
Зафиксируем какую-либо пару (¿о,^'о) чистых стратегий игроков.
Под бесконечной повторяющейся игрой будем понимать процесс повторения биматричной игры в бесконечной последовательности раундов 0,1, 2,... . Предполагаем, что в раунде 0 реализуется априорно заданная пара (¿о, ,?о) чистых стратегий, а в каждом последующем (к + 1)-м раунде каждый игрок применяет свою чистую стратегию в зависимости от своей чистой стратегии, реализованной в раунде к, и в соответствии со своим типом поведения. Здесь мы рассматриваем два типа поведения. Первый тип — консервативный: игрок-консерватор не меняет номера своей чистой стратегии на следующем раунде. Второй тип — инновационный: игрок-инноватор в раунде к +1 применяет чистую стратегию, отличную от чистой стратегии, примененной им в раунде к.
Введем также в рассмотрение процесс, аналогичный описанному выше, в котором, однако, игроки в каждом последующем раунде отдают лишь вероятностные предпочтения своим чистым стратегиям, соответствующим их типам поведения. В этом процессе для каждого игрока в качестве инструмента генерирования решений выступает та или иная функция е-релаксированного выбора. Приведем соответствующее определение.
Фиксируем е € (0,1/2). Функцией е-релаксированного выбора первого игрока назовем любую пару (а, 1 — а) смешанных стратегий первого игрока, такую, что: а) 1 ^ а ^ 1 — е, если первый игрок — консерватор; б) 0 ^ а ^ е, если первый игрок — инноватор. Данное определение подразумевает, что первый игрок в раунде (к + 1) выбирает свою смешанную стратегию а при реализации в раунде к своей чистой стратегии 1 и выбирает смешанную стратегию (1 — а) при реализации в раунде к своей смешанной стратегии 2. Из определения следует, что, будучи консерватором, первый игрок в раунде (к + 1) задает большую вероятность своей чистой стратегии, реализованной в раунде к, и, будучи инноватором, задает большую вероятность своей чистой стратегии, отличной от реализованной им в раунде к. Аналогично функцией е-релаксированного выбора второго игрока назовем любую пару (/3,1 — /0) смешанных стратегий второго игрока, такую, что: а) 1 ^ ¡3 ^ 1 — е, если второй игрок — консерватор; б) 0 ^ ¡3 ^ е, если второй игрок — инноватор.
При а = 1 будем называть первого игрока чистым консерватором; при 1 > а ^ (1 — е) — е-кон-серватором; при а = 0 — чистым инноватором; при 0 < а ^ е — е-инноватором. Аналогичные наименования примем для второго игрока.
Каждую пару
= ((«, 1 — а), (/3, 1 — /?)), (2)
где (а, 1 — а) — функция е-релаксированного выбора первого игрока и (/3,1 — /3) — функция е-релаксированного выбора второго игрока, будем называть парой функций е-релаксированного выбора игроков.
Для произвольной пары Б функций е-релаксированного выбора игроков (2) рассмотрим случайный процесс, который назовем е-релаксированной бесконечной повторяющейся игрой, соответствующей Б. Процесс состоит из раундов 0,1,2,..., в каждом из которых игроки разыгрывают описанную в п. 2 биматричную игру. Процесс развивается по следующей схеме. В раунде 0 реализуется начальная пара (¿о, ¿о) чистых стратегий игроков. Если в раунде к реализуется пара чистых стратегий игроков,
то первый игрок для выбора своей чистой стратегии в раунде к + 1 производит статистический эксперимент на множестве своих чистых стратегий, применяя смешанную стратегию а, если г^ = 1, и стратегию (1 — а), если г^ = 2. Аналогично второй игрок для выбора своей чистой стратегии в раунде к + 1 производит статистический эксперимент на множестве своих чистых стратегий,
применяя смешанную стратегию /3, если ^ = 1 и стратегию (1 —/3), если ¿к = 2. По окончании каждого раунда игроки получают очки согласно своим матрицам выигрышей. Данный процесс представляет собой модель поведения взаимодействующих игроков, которая в случае е > 0 допускает большую гибкость в выборе действий по сравнению с детерминированной игрой.
Уточним определение обозначенного выше случайного процесса. Пространством его состояний служит произведение X = {1,2} х {1,2} множеств чистых стратегий первого и второго игроков, его временной шкалой — индексы 0,1,2,... раундов повторяющейся игры. Пространство X понимаем как измеримое пространство, снабженное алгеброй всех его подмножеств. Для каждого к = 0,1,... функция на X х X вида
Рз((гк+1,.1к+1)\(гк,.1к)) = <
'«н/%, если (^+1,^+1) = (1,1),
(1 - а,гк)/%, если (^+1,^+1) = (2,1),
«¿Л1 если {к+ъЗк+г) = 2), 1(1 - «»*)(! - Рзк), если = (2,2),
где
а _ 1«, если ¡к = 1, -</0' если^ = 1,
%к 1 I — п. если = 2, Зк 1 1 — /3, если ^ = 2,
задает переходную вероятность между двумя экземплярами измеримого пространства X, отвечающими моментам времени к и к + 1.
В соответствии со стандартным определением случайного процесса (см., например, теорему Ионоску Тулча [11]) указанные переходные вероятности и начальное состояние (¿о,^о) определяют случайный процесс, траекториями которого выступают последовательности
t=((i1,j1),(i2,32),•••)€X00. (3)
Множество Х°° всех траекторий данного случайного процесса имеет при этом структуру вероятностного пространства с вероятностью рз, определенной на с-алгебре подмножеств порожденной всеми множествами вида х X х X х ..., где
^ = к = 1,2,.... (4)
При этом
РяЦЫ х X х X х ...) =рз{{1к^к)\{1к-ъ^к-1))рз{{гк-ъ^к-1)\{к-2^к-2)) ■ ■ -РэЦгик)\(к,Зо))- (5)
Данное вероятностное пространство будем обозначать через (Х°°,рз). Легко видеть, что указанная выше ст-алгебра подмножеств Х°° содержит все одноэлементные подмножества. Отсюда из счетности Х°° вытекает, что данная ст-алгебра есть совокупность всех подмножеств Х°°. Определенный выше случайный процесс будем рассматривать как формальную модель е-релаксированной бесконечной повторяющейся игры, соответствующей паре Б (2).
Для каждой траектории £ (3) и каждого п= 1,2,... введем значения средних выигрышей, реализуемых на первых п раундах игры вдоль данной траектории:
^ п | п
) = - 2 * '3* ' = ,3* ■ (6)
к=1 к=1
Для каждой пары Б функций е-релаксированного выбора игроков функции ап(-) и Ьп(-), п = 1,2,..., представляют собой случайные величины на вероятностном пространстве (Х°°,рз). Математические ожидания случайных величин (6), задаваемые выражениями
о„[5] = I ап(1)рз(сИ), Ъп[Б) = ^ М*Ы<Й), (7)
Хп X»
назовем ожидаемыми средними выигрышами соответственно первого и второго игроков в п раундах е-релаксированной повторяющейся игры, отвечающей паре Б.
3. Выигрыши игроков в с -рел аксированной бесконечной повторяющейся игре. Зафиксируем произвольную пару в функций е-релаксированного выбора игроков вида (2). Рассмотрим е-релаксированную бесконечную повторяющуюся игру, соответствующую паре в. Найдем выражение для ожидаемого среднего выигрыша первого игрока в п раундах этой повторяющейся игры. Для каждой траектории £ € Х°° вида (3) и каждого натурального к обозначим
= а*[5] = J а*(ф5(<Й). (8)
Последнее значение есть ожидаемый выигрыш первого игрока на раунде к в рассматриваемой повторяющейся игре. Для ожидаемого среднего выигрыша первого игрока в п раундах рассматриваемой повторяющейся игры в соответствии с (6) и (7) имеем
^ п
к=1
Возьмем какое-либо натуральное к. Подсчитаем (8). В силу (4), (5)
^ Рз((гк-1,Зк-1)\(ък-2,Зк-2)) Е агк,зиРз{{гк,Зк)\{гк-ъЗк-\))- (Ю)
Для произвольных т € {0,1,..., к — 1} и {гт-,3т) € X (при т = 0 (¿о,^'о) — начальная пара чистых стратегий, которую для удобства считаем здесь переменной) положим
ат,к^т,3т)= Е Рз((гт+1,3т+1)\(гт,3т)) ■ ■ • ^ "нлР^'Ь Зк) I Зк-1)) • (И)
^т+1,3т+1)ех (1к,3к)ех
Очевидно, (11) есть ожидаемый выигрыш первого игрока в рассматриваемой повторяющейся игре на раунде к при условии, что на раунде т реализована пара {гт-,3т) чистых стратегий игроков. Ясно, что при т = О
= о,^о). (12)
В силу (10) при т > О
= Е РзЦгъЗгШо.Зо)) ■■■ Е
(ч,:Н)ех (гт,3т)ех
Введем матрицы
й _ й ГС1 — (1) ®т,к( 1; 2)\ _ и _ л
ит,к — и"т,к1°\ — I - м 1\ ~ /"о 0'\ / ' — ' ' ' ' ' ' '
\0"т,к (2,1) атоД2, 2)/
а также матрицы а = а[5] = ^ ° а а ^' @ = = (^1 ^ /3 /3 ^'
Лемма 1. Справедливо представление агп^ = ак~т Арк~т, т = 0,1,..., к — 1. Следствие 1. Справедливо представление
аа,к = акАрк. (13)
а
(к) Jk)\ (ft(k) o(fc)N
11 12 I ok _ I Pll Pl2
Рассмотрим матрицы afc = ^ ^ , /3fc = ^ .
\«21 «22 / \P21 P22 /
Лемма 2. Справедливы соотношения ^ 0, /3^ ^ 0, i,j = 1,2,
«12 = «21 = 1 - «1И «22 =«11% /?12 = /?21 = 1 ^ «1 % fj22 =fjll - (14)
Введем упрощенные обозначения «(*) = /3« = ■ Принимая во внимание (14), имеем
«1? = «2? = 1 - а(к)<- а22 = а(к)<, Р12 = Р21 = 1 ^ /3(Ч Р{22] = /3«. Таким образом,
ак =
а« 1 -
1 -
а«
=
р(к) 1-рЮ
1 - /3« /3«
(15)
Следующая лемма позволяет вычислить (13) и, следовательно, значение (8).
Лемма 3. Справедливы представления
(к) _ (2а — 1)к + 1 (к) _ (2/3 - 1)" + 1 2 ' 2
(16)
Согласно (13), (15), (16), матрица средних выигрышей первого игрока на шаге к равна
а0и = акА/Зк =
Перемножая матрицы, получаем
4а0)^(1,1) = оц + «12 + а,21 + а22 + (2а - 1)к[ац + а^ - а,2\ - а22]+
+ (2/3 - 1)к[ац - а12 + а21 - а22] + (2а - 1^(2/3 - 1)*[ац - а12 - а21 4а0)^(1, 2) = йц + а,\2 + а,2\ + а22 + (2а - 1)к[ац + а,12 - а,2\ - а22] +
а22\
+ (2/3 - 1)к[~ац + «12 - а21 + а22] + (2а - 1^(2/3 - 1)*[-ац + а12 + а21 - а22], 4а0)^(2,1) = йц + аг2 + а2г + а22 + (2а - 1)/г[^ац - аг2 + а2г + а22]+
+ (2/3 - 1 )к[ап - а12 + а21 - а22] + (2а - 1^(2/3 - 1 )*[-ац + а12 + а21 - а22], 4а0)^(2, 2) = йц + аг2 + а2г + а22 + (2а - 1)/г[^ац - аг2 + а2г + а22]+
+ (2/3 - 1)'г[—ац + а12 - а21 + а22] + (2а - 1^(2/3 - 1)*[ац - а12 - а21 + а22].
(17)
(18)
(19)
(20)
Аналогичные представления справедливы и для выигрышей второго игрока на шаге к.
Устремим к к бесконечности. Из леммы 2 с учетом неравенств из определения е-релаксированного выбора игроков выражений (17)-(20) и (9) вытекает следующая
Теорема 1. 1. Для е-релаксир о ванной бесконечной повторяющейся игры, соответствующей паре Б функций е-релаксированного выбора игроков (2), существует предел
а[<5] = Нт ап[<5].
(21)
2. При заданной начальной паре (га,,]а) чистых стратегий а[<5] принимает 5 значений в зависимости от того, какая из комбинаций условий, приведенных ниже в табл. 1, имеет место.
Предел а[<5] (21) назовем ожидаемым выигрышем первого игрока в е-релаксированной бесконечной повторяющейся игре, соответствующей паре Б (2).
Замечание 1. Как видно из табл. 1, при стремлении первого игрока от е-консерватизма к чистому консерватизму, т.е. при стремлении а к 1 снизу (без вариаций вторым игроком значения /3), его ожидаемый средний выигрыш а[<5], вообще говоря, не стремится к значению, соответствующему случаю а = 1. Аналогичного рода разрывы имеют место при стремлении а к 0 сверху.
Замечание2. При использовании игроками только строго рандомизированных стратегий е-консерватизма и е-инноваторства мы избегаем разрывов в ожидаемых средних выигрышах и имеем частный случай теоремы о предельных переходных вероятностях [12, XIII, § 7].
4. Равновесные поведения двух консерваторов. Для каждого игрока-консерватора выбор им чистого консерватизма (т. е. выбор а = 1 в случае первого игрока и /3 = 1 в случае второго игрока) принимаем за его стратегию поведения 1, а выбор им е-консерватизма (т.е. выбор произвольного а € [1 — е, 1) в случае первого игрока и произвольного /3 € [1 — е, 1) в случае второго игрока) — за его стратегию поведения 2.
Таблица 1
Условия Поведение первого игрока Поведение второго игрока о[5]
а,/3 Е (0,1) е-консерватор либо е-инноватор е-консерватор либо е-инноватор «11 + «12 + «21 + «22 4
а = 1, /3 е (0,1) Чистый консерватор е-консерватор либо е-инноватор а11+а12 ((го,л>)е{(1,1),(1,2)}), а21+а22 ((го,^о)е{(2,1),(2,2)}).
а = о, ¡3 е (0,1) Чистый инноватор е-консерватор либо е-инноватор ац + «12 + а21 + «22 4
а е (0,1), /3 = 1 е-консерватор либо е-инноватор Чистый консерватор а"+а21 ((го,л>)е{(1,1),(2,1)}), а12+а22 ((го,^о)е{(1,2),(2,2)}).
а е (0,1), /3 = 0 е-консерватор либо е-инноватор Чистый инноватор ац + «12 + а21 + «22 4
а = 1, /3 = 1 Чистый консерватор Чистый консерватор а»о ,30
а = 0, /3 = 1 Чистый инноватор Чистый консерватор а"+а21 ((го,^о)е{(1,1),(2,1)}), а12^22 ((»о,Л)б {(1,2), (2, 2)})
а = 1, /3 = 0 Чистый консерватор Чистый инноватор а"+а12 ((го,^о)е{(1,1),(1,2)}), а21^22 ((»о,Л)б {(2,1), (2, 2)})
а = 0, /3 = 0 Чистый инноватор Чистый инноватор а"+а22 ((го,^о)е{(1,1),(2,2)}), ^ з"21 ((»о,Л)б {(1,2), (2,1)})
Основываясь на табл. 1, задающей значения ожидаемого выигрыша а[<5] первого игрока и аналогичной таблице для второго игрока, расположим эти значения в матрицах А* и В* соответственно. Именно на пересечении строки 1 и столбца ] матриц А* и В* поместим соответственно значения а[Б) и Ь[Б], отвечающие стратегии поведения г первого игрока и стратегии поведения ] второго игрока. Получаем:
1) при (¿о,*,) = (1,1) /
А*(1,1) =
ац
Оц + 012
Оц + О 21 ОЦ + 012 + О 21 + в'22
V
2) при (г0,Зо) = (1,2) /
А* (1,2) =
а 12
V
3) при (г0,Зо) = (2,1) /
А* (2,1) =
Й21
V
ац + а 12
012 + О22 ац + а 12 + Й21 + (¿22
Й21 + а22
ац + 0,21 Оц + 0,12 + 021 + 0,22
В* (1,1) =
т 1- «12
т
^11 -I- 021 Ои -I- 012 -I- 021 -I- 022
\ 2
В*( 1,2) =
П2
\ 2
В* (2,1) =
->21
\ 2
->11 1- 012
->21 1- 022
>12 -I- 022 Оц -+- 012 -I- 021 + »22
>11 -I- 021 Оц -I- 012 -I- 021 -I- 022
4) при (¿о^'о) = (2,2) /
А* (2,2) =
Й22
О 21 + О 22
V
012 + 022 ЙЦ + Й12 + О 21 + ^22
В* (2,2) =
7
1 -I- 022
'22
'12 -I- 022 "1 1 -I- 012 -I- 021 -I- 022
V
7
Введем в рассмотрение поведенческую игру двух консерваторов, в которой чистыми стратегиями первого и второго игроков-консерваторов выступают их стратегии поведения 1 и 2, а матрицами выигрыша — А* и В* соответственно. Рассмотрим вопрос о наличии в поведенческой игре двух консерваторов ситуации равновесия по Нэшу в классах чистых стратегий (поведения). Учитывая вид
П* ^ а,ц + а, 21 Й12 + «22 „ Оц + «21 ^ «12 + «22 матриц А и В и соотношения ац > ---, «12 < ---, «21 < -^-, «22 > -^-
, ¿>11 + Ъ\2 , ¿>11 + Ъ\2 , ¿>21 + ¿>22 , ¿>21 + ¿>22
и ¿>и < -^-' 12 :> -2-' '> -2-' -2-' получаем слеДУюЩии результат.
Для поведенческой игры двух консерваторов информация о существовании и виде ситуации равновесия по Нэшу в классах чистых стратегий (поведения) дается в следующей табл. 2.
Таблица 2
(го,¿о) Условия для А Условия для В Равновесие по Нэшу
(1Д) «11 + «12 < «21 + «22 ац + «12 < а21 + «22 ац + а12 > 021 + агг ац + 012 > а21 + агг Ьц + &21 > Ь12 + Ь22 Ьц + Ьг1 < Ь\2 + Ьгг Ьц + Ьг1 > Ь\2 + Ьгг Ьц + Ьг1 < Ь\2 + Ьгг Не существует (2,2) (1,2) (1,2)
(1.2) ац + 012 < аг1 + агг ац + 012 < аг1 + агг ац + 012 > аг1 + агг ац + 012 > аг1 + агг Ь\2 + Ьгг > Ьц + Ьг1 Ь\2 + Ьгг < Ьц + Ьг1 Ь\2 + Ьгг > Ьц + Ьг1 Ь\2 + Ьгг < Ьц + Ьг1 (2Д) (2,2) (2Д) Не существует
(2Д) ац + 012 > аг1 + агг ац + 012 > аг1 + агг ац + 012 < аг1 + агг ац + 012 < аг1 + агг Ьц + Ьг1 > Ь\2 + Ьгг Ьц + Ьг 1 < Ь\2 + Ьгг Ьц + Ьг1 > Ь\2 + Ьгг Ьц + Ьг1 < Ь\2 + Ьгг (2Д) (2,2) (2Д) Не существует
(2,2) ац + 012 > аг1 + агг ац + 012 > аг1 + агг ац + 012 < аг1 + агг ац + 012 < аг1 + агг Ьц + Ьг1 < Ь\2 + Ьгг Ьц + Ьг 1 > Ь\2 + Ьгг Ьц + Ьг1 < Ь\2 + Ьгг Ьц + Ьг1 > Ь\2 + Ьгг Не существует (2,2) (1,2) (1,2)
Обращаем внимание на то, что, в соответствии с табл. 2, ситуация равновесия по Нэшу в поведенческой игре двух консерваторов в тех случаях, когда она существует, всегда имеет поведенческую стратегию 2 (е-консерватизм) в качестве, по крайней мере, одной из компонент. Таким образом, взаимный чистый консерватизм (пара (1,1)) не является устойчивым взаимоприемлемым выбором игроков-консерваторов при допущении сколь угодно малых вероятностных отклонений от чистого консерватизма.
При аналогичном рассмотрении поведенческой игры двух инноваторов и поведенческой игры консерватора с инноватором информацию о существовании и виде ситуации равновесия по Нэшу в классах чистых стратегий (поведения) получаем в виде следующей табл. 3 для поведенческой игры двух инноваторов и табл. 4 для поведенческой игры консерватора и инноватора.
Табл и ца 3
(го,Зо) Равновесие по Нэшу
(1.1) (1,2) и (2,2)
(1,2) (2,1) и (2,2)
(2Д) (2,1) и (2,2)
(2,2) (1,2) и (2,2)
Таблица 4
(го, jo) Условия на А Равновесие по Нэшу
(1,1) «11 + Я12 > «21 + «22 an + ai2 < a2i + «22 (1,1) и (1,2) (2,1) и (2,2)
(1,2) «11 + «12 > «21 + «22 «11 + «12 < «21 + «22 (1,1) и (1,2) (2,1) и (2,2)
(2,1) «11 + «12 > «21 + «22 «11 + «12 < «21 + «22 (2,1) и (2,2) (1,1) и (1,2)
(2,2) «11 + «12 > «21 + «22 «11 + «12 < «21 + «22 (2,1) и (2,2) (1,1) и (1,2)
В соответствии с табл. 3 взаимное чистое инноваторство (пара (1,1)) не является устойчивым взаимоприемлемым выбором игроков-инноваторов при допущении сколь угодно малых вероятностных отклонений от чистого инноваторства. Кроме того, взаимное е-инноваторство является ситуацией равновесия при любых начальных условаиях в игре двух инноваторов.
Автор выражает признательность своему научному руководителю акад. А.В. Кряжимскому за постановку задачи и руководство в процессе ее решения.
СПИСОК ЛИТЕРАТУРЫ
1. Axelrod R. The Evolution of Cooperation. N.Y.: Basic Books, 1984.
2. Hofbauer J., Sigmund K. The Theory of Evolution and Dynamical Systems. Cambridge: Cambridge University Press, 1988.
3. Weibull J. Evolutionary Game Theory. Cambridge: The M.I.T. Press, 1995.
4. Fudenberg D., Kreps D.M. Learning mixed equilibria // Games and Economic Behavior. 1993. 5. P. 320367.
5. No wan M., Sigmund K. The alternating prisoner's dilemma //J. Theor. Biol. 1994. 168. P. 219-226.
6. Van der Laan G., Tieman X. Evolutionary game theory and the modeling of economic behavior //De Economist. 1998. 146. N 1. P. 59-89.
7. Kaniovski Yu.M., Kryazhimskiy A.V., Young H. P. Learning equilibria in games played by heterogeneous populations // Games and Economic Behavior. 2000. 31. P. 50-96.
8. Кряжимский А. В., Осипов Ю. С. О дифференциально-эволюционных играх // Тр. МИАН. 211. 1995. С. 257-287.
9. Kleimenov A. F., Kryazhimskiy A.V. Minimum-noncooperative trajectories in repeated games//Complex Dynamical Systems with Incomplete Information. Aachen: Shaker Verlag, 1999. P. 94-107.
10. Воробьев H. H. Теория игр для экономистов-кибернетиков. М.: Наука, 1985.
11. Неве Ж. Математические основы теории вероятностей. М.: Мир, 1969.
12. Гантмахер Ф.Р. Теория матриц. М.: Наука, 1966.
Поступила в редакцию 24.06.11
ON THE CHOICE OF THE EQUILIBRIUM BEHAVIOR IN THE 2x2 INFINITELY REPEATED GAME: CASE OF PLAYERS-CONSERVATORS AND PLAYERS-INNOVATORS
Raygorodskaya A. V.
A 2 x 2 infinitely repeated game, in which each player in each subsequent round chooses a pure strategy based on the result of a random test, is analyzed; the random test is generated by the player's arbitrary mixed strategy prescribing the player to choose his/her pure strategy corresponding to his type of behavior: conservative or innovative, with a high probability. The game is analyzed for various cases of interaction between players-conservators and players-innovators.
Keywords: infinitely repeated games, bimatrix games, equilibria.