Научная статья на тему 'Кооперативные дифференциальные игры с ограниченными ресурсами у игроков'

Кооперативные дифференциальные игры с ограниченными ресурсами у игроков Текст научной статьи по специальности «Математика»

CC BY
153
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КООПЕРАТИВНЫЕ ИГРЫ / ДЕЛЕЖ / ПОБОЧНЫЕ ПЛАТЕЖИ / УСТОЙЧИВОСТЬ / КОЛЛЕКТИВНЫЕ СОГЛАШЕНИЯ / COOPERATIVE GAMES / SIDE PAYMENTS / STABILITY / COLLECTIVE AGREEMENTS / PAYOFF VECTOR

Аннотация научной статьи по математике, автор научной работы — Скитович Владимир Викторович

В статье рассматривается проблема устойчивости коллективных соглашений в кооперативных дифференциальных играх. Построены побочные платежи, которые обеспечивают для достигнутого игроками соглашения устойчивость по Нэшу. Найдены достаточные условия, при которых рассмотренное коллективное соглашение будет устойчивым.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COOPERATIVE DIFFERENTIAL GAMES WITH LIMITED RESOURCES AT PLAYERS

The article deals with the problem of stability of collective agreements in cooperative differential games. Built side payments which provide for the agreement reached by players Nash equilibrium. Found sufficient conditions under which reviewed the collective agreement will be sustainable.

Текст научной работы на тему «Кооперативные дифференциальные игры с ограниченными ресурсами у игроков»

КООПЕРАТИВНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ С ОГРАНИЧЕННГЫМИ РЕСУРСАМИ У ИГРОКОВ

Скитович Владимир Викторович

доцент, канд. физ.-мат. наук, Санкт-Петербургский государственный

университет, РФ, г. Санкт-Петербург Email: wskit@yandex.ru

COOPERATIVE DIFFERENTIAL GAMES WITH LIMITED RESOURCES

AT PLAYERS

Vladimir Skitovich

associate Professor, candidate of physical-mathematical Sciences, St. Petersburg

state University, Russia, St. Petersburg

АННОТАЦИЯ

В статье рассматривается проблема устойчивости коллективных соглашений в кооперативных дифференциальных играх. Построены побочные платежи, которые обеспечивают для достигнутого игроками соглашения устойчивость по Нэшу. Найдены достаточные условия, при которых рассмотренное коллективное соглашение будет устойчивым.

ABSTRACT

The article deals with the problem of stability of collective agreements in cooperative differential games. Built side payments which provide for the agreement reached by players Nash equilibrium. Found sufficient conditions under which reviewed the collective agreement will be sustainable.

Ключевые слова: кооперативные игры; дележ; побочные платежи; устой -чивость; коллективные соглашения.

Keywords: cooperative games; payoff vector; side payments; stability; collective agreements

Дадим формальное определение рассматриваемого класса игр n лиц. Пусть динамика развития игры задается дифференциальным уравнением:

dxt) = f (x, t, щ, щ , щ), t е [t0, T] с начальным условием x(tQ) = x0, (1) dt

w created by free version of

i) DociFreezer

где: щ е и (, = 1,2,...,п) — управления выбираемые игроками; Т — момент времени окончания игры.

Если в результате выбранных игроками управлений реализуется траектория х(г), г е [г0, Т], то степень удовлетворения интересов каждого из игроков определяется его функцией выигрыша:

Т

К (г0, х(г)) = | Н, (х(г))Ш + Н, (х(Т)) , (2)

го

где: [ Н(х(т))^т — текущий выигрыш /-ого игрока к моменту времени ^ ;

Ло

Н (х(Т)) — терминальный выигрыш, получаемый отдельным игроком в момент окончания игры.

Кооперативный характер игры предполагает трансферабельность выигрышей и возможность совместных действий игроков, т. е. образование коалиций 5 с N, где N — множество всех участников игры (Щ = п).

Потенциальные возможности отдельной коалиции £ определяются характеристической функцией игры — V (5, х0), которая в данном случае будет иметь следующий вид:

V(5,хо) = тах ш1и £Кг,х(г)), где Ц8 = Пи, и ит8 = Пик . (3)

При этом, характеристическая функция общей коалиции будет равна

V (N, хо) = шах £ К г (го, х (г)) = £ К г х * (г)), (4)

х(г) ^ ^

где х* (г) — оптимальная траектория данной игры, вдоль которой суммар-ный выигрыш игроков максимален.

Поскольку реализация оптимальной траектории игры требует согласован -ных действий всех игроков, а интересы каждого из них будут удовлетворены в

различной степени, то необходимым условием общего согласия становится распределение индивидуальных доходов. Поэтому под решением кооперативной игры понимается некоторый дележ й = (, й2,..., йп), удовлетворяющий

следующим условиям:

1. Условие индивидуальной рациональности : й. > V({}, х0), г = 1,2,..., п.

п

2. Условие коллективной рациональности : ^ йг = V (N, х0).

г=1

Выбор дележа представляет собой самостоятельную проблему, которой за -нимаются и социологи, и политологи, и математики. Поэтому будем считать, что дележ й однозначно определяется некоторым принципом оптимальности, признаваемым всеми игроками и реализующим господствующее понимание социальной справедливости. Сформулированную таким образом дифференциаль -ную игру обозначим через Г(х0, Т).

Реализация дележа достигается путем выплаты игроками в ходе игры по -бочных платежей. Под побочными платежами в игре Г( х0, Т) будем понимать

вектор-функцию ¡л(г) = (м (г), м (г),..., мп (г)), которая обладает следующими свойствами:

1. м (г0) = 0, г = 1,2,., п;

п

2. (г) = 0, Vг е [г0, Т];

г=1

Т

3. й =М (Т) + | кг (X * (/))й/ + Иг (X * (Т)), г = 1,2,., п,

го

где м (г) — размер выплат отдельному игроку остальными игроками к мо -менту времени г е [г0, Т] (или наоборот, если значение функции м (г) оказывается отрицательным).

Предполагается, что для осуществления побочных платежей каждый из игроков обладает определенным количеством ^ > 0, некоторого трансферабельного ресурса, а также может использовать текущий выигрыш.

^ сгеа1ес1 Ьу ^ее уетоп of

д ОоаРгеетег

Побочные платежи л(г) будем называть реализуемыми, если игроки в состоянии их осуществить, т. е. для всех значений г е [г0, Т] выполняются неравенства:

г

Л (г) + | кг (х* (т))Ж + ^ > 0, / = 1,2,..., п. (5)

го

Таким образом, коллективное соглашение в игре Г( х0, Т) будет собой представлять тройку <х* (г), ^, ¡(г)>, где х* (г) — оптимальная траектория развития игры, й — дележ, ¡(г) — побочные платежи, реализующие этот дележ.

Для анализа устойчивости возможных соглашений, наряду с игрой Г (х0, Т), будем рассматривать также порождаемые ею подыгры Г( х* (г), Т), которые отличаются от исходной игры только начальными условиями и продолжительностью. Характеристическую функцию и дележ в подыгре Г(х* (г), Т) обозначим соответственно через V(5, х* (г)) и ¿(1), значения которых определяются по тем же правилам, что и в исходной игре. При этом значения характеристических функций игры и подыгр будут связаны между собой следующими уравнениями Беллмана:

п г

V(N, х0) = £ | кг (х* (т)^т + V(N, х* (г)), если г е [г0, Т) (6)

1 го

и V (5, х * (Т)) = £ Н (х * (Т)) = £ ^ (Т), если г = Т. (7)

Коллективное соглашение <х* (г), ^, ¡(г)> будем называть устойчивым, если для любой коалиции 5 с N в каждый момент времени г е [г0, Т) выполняется неравенство:

г

V(S,X(t)) + X[Jh(x'{r))dr + ^(t)] d, . (8)

ieS f ieS

Содержательно, это определение означает, что ни одной из коалиций невыгодно в ходе игры нарушить достигнутое соглашение и начать действовать

created by free version of

самостоятельно. Анализ неравенств, определяемых формулой (8), позволяет сделать ряд выводов. Пусть t = t0, тогда неравенство (8) примет следующий вид:

VS с N V(S, x0) d . (9)

ieS

В теории кооперативных игр неравенства (9) известны как условие коалиционной рациональности и множество дележей удовлетворяющих этому условию принято называть ядром игры. Исходя из этого, можно сделать следующий вывод:

Утверждение 1. Для устойчивости соглашения <x* (t), d, ju(t)> необходимо, чтобы вектор дележей d принадлежал ядру игры Г(x0, T).

Рассмотрим другой частный случай, когда функция побочных платежей построена следующим образом:

J(t) = d - d(t) - jh(x*(r)dr, i = Ъ2,--',n. (10)

t0

Содержательный смысл формулы (10) состоит в том, что если в какой-либо момент времени t е (t0, T) соглашение будет пересмотрено, то в силу равенства (6) суммарный выигрыш игроков останется неизменным и индивидуальные выигрыши также не изменятся, поскольку

t

d] = j h (x* (r))dr + J (t) + d (t) = d , i = 1,2,-, n . (11)

t0

Следовательно, на индивидуальном уровне ни одному из игроков нет смысла в ходе игры настаивать на пересмотре соглашения.

Утверждение 2. Если побочные платежи J (t), t е [t0, T] реализуемы, то коллективное соглашение < x* (t), d, J (t )> будет равновесным по Нэшу.

Однако не исключено, что нарушение соглашения может в какой-либо момент времени оказаться выгодным для некоторой из коалиций. Нетрудно

created by free version of

DociFreezer

проверить, что побочные платежи ¡л (г), г е [г0, Т] обеспечивают выполнение неравенства (8), если для каждой из подыгр Г(х* (г), Т) выполняется условие коалиционной рациональности:

V(5, х* (г)) й., с N.

Утверждение 3. Если для всех значений г е [г0, Т) дележ й(г) принадлежит ядру подыгры Г( х* (г), Т), а побочные платежи (г) реализуемы, то коллективное соглашение < х* (г), й, ¡л* (г )> будет устойчивым.

К сожалению, большинство содержательных игр имеет пустое ядро и поэтому весьма часто коллективные соглашения оказываются неустойчивыми. Исключение представляют игры двух лиц, для которых ядро всегда не пусто и совпадает с множеством всех дележей. В этом случае вопрос устойчивости сводится к ресурсному обеспечению и отысканию реализуемых побочных платежей. Полученные результаты позволяют объяснить популярность и эффективность двусторонних соглашений, особенно, когда речь идет об обеспечении безопасности договаривающихся сторон. Для обеспечения устойчивости многосторонних соглашений необходимо создание и развитие соответствующих социальных институтов, таких как право, суд, армия и т. п.

^ сгеа1ес1 Ьу ^ее уетоп

д ОоаРгеетег

i Надоели баннеры? Вы всегда можете отключить рекламу.