Научная статья на тему 'Построение решений в одной повторяющейся неантагонистической игре трех лиц'

Построение решений в одной повторяющейся неантагонистической игре трех лиц Текст научной статьи по специальности «Математика»

CC BY
122
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОВТОРЯЮЩАЯСЯ ИГРА ТРЕХ ЛИЦ / КОНЕЧНОЕ ЧИСЛО СТРАТЕГИЙ / ТИПЫ ПОВЕДЕНИЯ / REPEATED THREE-PERSON GAME / FINITE NUMBER OF STRATEGIES / BEHAVIOR TYPES

Аннотация научной статьи по математике, автор научной работы — Клейменов Анатолий Федорович

В рассматриваемой игре два игрока действуют в классе смешанных стратегий, а третий игрок в классе чистых стратегий. Предлагаемый подход к построению динамики повторяющейся игры основан на: принципе неухудшения гарантированных выигрышей игроков [1, 2], на специальной процедуре нахождения нэшевских решений в вспомогательных биматричных играх, а также на использовании различных типов поведения игроков [3, 4]. Рассмотрен пример игры трех лиц типа дилеммы заключенного [5].

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Клейменов Анатолий Федорович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SOLUTIONS CONSTRUCTING IN A REPEATED NONANTAGONISTIC THREE-PERSON GAME

In the considered game two players act in the class of mixed strategies, while the third player acts in the class of pure strategies. The suggested approach for building dynamics uses the principle of non-decrease of players' payoffs, some special procedure of using Nash equilibria in auxiliary bimatrix games and various behavior types for players.

Текст научной работы на тему «Построение решений в одной повторяющейся неантагонистической игре трех лиц»

Kirichenko М.A., Rubanov N.A., Agabekyan Е.А. About application symbolic computing for construction of generalized-periodic solutions of systems of ordinary differential equations with multilinear right side. Based on the method of successive approximations of Picard based decision systems ordinary differential equations with multilinear term.

Key words: symbolic computation; the method of successive approximations of Picard; Lorenz system; the construction of non-local solutions of system of ordinary differential equations with multilinear right side.

Кириченко Михаил Александрович, Тамбовский государственный технический университет, г. Тамбов, Российская Федерация, аспирант кафедры ПМиИ, e-mail: kirimedia@gmail .com.

Рубанов Никита Александрович, Тамбовский государственный технический университет, г. Тамбов, Российская Федерация, аспирант кафедры ПМиИ, e-mail: nikitarubanov@gmail.com.

Агабекян Эмиль Паргевович, Тамбовский государственный технический университет, г. Тамбов, Российская Федерация, аспирант кафедры экономического анализа, e-mail: emill2007@yandex.ru.

УДК 517.977

ПОСТРОЕНИЕ РЕШЕНИЙ В ОДНОЙ ПОВТОРЯЮЩЕЙСЯ НЕАНТАГОНИСТИЧЕСКОЙ ИГРЕ ТРЕХ ЛИЦ

© А.Ф. Клейменов

Ключевые слова: повторяющаяся игра трех лиц; конечное число стратегий; типы поведения.

В рассматриваемой игре два игрока действуют в классе смешанных стратегий, а третий игрок — в классе чистых стратегий. Предлагаемый подход к построению динамики повторяющейся игры основан на: принципе неухудшения гарантированных выигрышей игроков [1, 2], на специальной процедуре нахождения нэшевских решений в вспомогательных биматричных играх, а также на использовании различных типов поведения игроков [3, 4]. Рассмотрен пример игры трех лиц типа дилеммы заключенного [5].

Рассмотрим следующую повторяющуюся игру трех лиц с конечным числом стратегий. Обозначим через I, т и п число стратегий игроков 1, 2, и 3 соответственно. Обозначим через ,д%]к и выигрыши игроков 1, 2 и 3 соответственно, доставляемые тройкой

стратегий (г, ], к), где г Е Ь = {1,..., I}, ] Е М = {1,..., т} и к Е N = {1,..., п}.

Пусть игроки выбирают свои стратегии последовательно в моменты 1, 2,.... Предполагаем, что в каждый момент £ игроки 1 и 2 действуют в классе смешанных стратегий, в то время как игрок 3 использует только чистые стратегии из множества N. Смешанные стратегии "р = (р\, ...,Р1) игрока 1 и 1} = (}1, ...,}т) игрока 2 определяются стандартным образом и выбираются из симплексов Б—1 и Бт-\ соответственно. При фиксированном состоянии игры (р1,1 ,к) Е Б = Б;—1 х Бт-1 х N ожидаемый выигрыш игрока 1 определяется формулой

I т

/(1, 1, к) = ^ ^ . (1) i=l]=1

Ожидаемые выигрыши игроков 2 и 3 получаются заменой в (1) символа f на g и h соответственно.

Рассмотрим следующую кооперативную динамику повторяющейся игры. Предположим, что в каждый момент t игроки знают текущее состояние (+t, +t, kt) и выбирают состояние (Pt+i, Qt+i, kt+i) в дамент t + 1 с учетом следующего ограничения:

(pt^,—!) е Ua,f£p t,~q t) = {(~P,~q) е Si-1 xSm-i: \pi,t - pi\^a\qjtt - qj \ ^ в, i e L,j e M}, (2)

где а и в — достаточно малые положительные числа. При этом выбор величины kt+i е N описывается ниже.

При фиксированном k*+i е N рассмотрим следующие две задачи.

Задача!.. Найти пару (+Рi, 1+^, доставляющую максимум функции f (+Р, 1+, k*+i) на множестве Ua,e ( p t, q t) (2) при уело вин g(p, q , k*+i) ^ g(pt, qt, k^+i).

3 а д а ч a 2. Найти пару (~p 2, ~q 2), доставляющую максимум функции g(~p , ~q , k+i)

на множестве Ua,e (p t, Q t) (2) условии f (p, q ,k%+i) ^ f (pt, qt ,k^+i).

Рассмотрим вспомогательную биматричную игру (A*,B*) с матрицами

A* =( f (p+, op,k*+i) f (p+, q+ ,k*+i A B* =( g(pp, op,k*+i) g(pp, P,k*+i)\ 3

\f(p2,qi,k**+i) f(p2,q2,k*+iW , \g(p2,qi,k*+i) g(p2,q2,k*+i) )

i pp i, j

рока 2 есть выбрать ~q j, i = 1, 2; j = 1, 2. Нетрудно показать, что биматричная игра (A*, B*) имеет по крайней мере одно нэшевское равновесие в чистых стратегиях. Возможны два случая. Первый, когда игра имеет единственное нэшевское равновесие (+p N, ~q N) ; тогда оно и выбирается в качестве (-t+i, -++). Второй случай, когда игра имеет два нэшев-ских равновесия (+p Ni,1+Ni) и (+p N2,~q N2); тогда выбирается (-tp, —+i) = 0, 5(+p Ni + + +p N2,~q Ni + ~q N2). Таким образом, пара (-—+, —++) определена; она зависит от k*+ i.

kt+

h(p+p,p+p,kt+1) - h(+t, +t,kt) ^ 0. (4)

kt+

части (4).

Таким образом, динамика рассматриваемой повторяющейся игры полностью определена. Помимо локальных критериев игроков, заданных в (1), в приложениях нередко встречаются также добавочные глобальные критерии, оценивающие качество процесса в целом. И не всегда вышеприведенная динамика, основанная на локальных критериях (1), приводит к оптимизации добавочных глобальных критериев. В работе предлагается использовать в процессе управления различные т. н. типы поведения игроков, что в ряде случаев может привести к успеху. Детально формализация различных типов поведения игроков приведена в [3J, а также в [4].

В работе приводятся результаты вычисления решений в повторяющейся игре трех лиц типа дилеммы заключенного.

ЛИТЕРАТУРА

1. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.

2. Красовс кий Н.Н. Управление динамической системой. М.: Наука, 1985.

3. Kleimenov A.F., Kryazimskii A.V. Normal behaviour, altruism and aggression in cooperative game dynamics j j IIASA, Laxenburg, 1998, IR 98-076.

4. Клейменов А.Ф. Различные типы решений в позиционной неантагонистической дифференциальной игре // Вестник Тамбовского университета. Серия: Естественные и технические науки. Тамбов. 2007. Т. 12. № 4. С. 464-466.

5. Straffin P. Game theory and strategies. Math. Associat. of America. Washington, 1993.

Поступила в редакцию 10 апреля 2011 г.

БЛАГОДАРНОСТИ: Работа выполнена в рамках программы Президиума РАН «Математическая теория управления», при финансовой поддержке УрО РАН (проект № 09—П—1—1015), а также Российского фонда фундаментальных исследований (проект № 09-01-00313).

Kleimenov A.F. Solutions constructing in a repeated nonantagonistic three-person game. In the considered game two players act in the class of mixed strategies, while the third player acts in the class of pure strategies. The suggested approach for building dynamics uses the principle of non-decrease of players’ payoffs, some special procedure of using Nash equilibria in auxiliary bimatrix games and various behavior types for players.

Key words: repeated three-person game; finite number of strategies; behavior types.

Клейменов Анатолий Федорович, Институт математики и механики УрО РАН, г. Екатеринбург, Российская Федерация, доктор физико-математических наук, профессор, ведущий научный сотрудник, e-mail: kleimenov@imm.uran.ru.

УДК 517.98

ПРЕОБРАЗОВАНИЕ РАДОНА В ПРОСТРАНСТВЕ ФУНКЦИЙ НА

БИНАРНЫХ МАТРИЦАХ

© С. В. Кольцова

Ключевые слова: пространство функций на бинарных матрицах; ядро и образ преобразования Радона; формула обращения.

Исследуется преобразование Радона в пространстве комплексных функций, заданных на бинарных матрицах. Описаны ядро и образ преобразования Радона, а, в случае его инъективности, получена формула обращения.

Пусть X — множество всех бинарных матриц размера т х п с обычной операцией сложения по пк^2 и адамаровым умножением. Пусть Ь(Х) — пространство функций / : X 1 С. Пусть М С X, Му = М + у = {т + у | т Е М}, У = {Му | у Е X}. Обозначим 6м характеристическую функцию множества М. Определим преобразование Радона Ем : L(X) 1 Ь(У) формулой

(Ем/)(у) = ^ /(х) = ^ 6м(у - X). (1)

хеМу хЕХ

Ем

Ем- ,

i Надоели баннеры? Вы всегда можете отключить рекламу.