Научная статья на тему 'Гарантированные по выигрышам и рискам дележи в кооперативной игре'

Гарантированные по выигрышам и рискам дележи в кооперативной игре Текст научной статьи по специальности «Математика»

CC BY
116
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КООПЕРАТИВНАЯ ИГРА БЕЗ ПОБОЧНЫХ ПЛАТЕЖЕЙ / РИСК / ГАРАНТИРОВАННЫЙ ДЕЛЁЖ / НЕОПРЕДЕЛЁННОСТЬ

Аннотация научной статьи по математике, автор научной работы — Аввакумов Андрей Владимирович

В кооперативной игре без побочных платежей и при неопределенности вводится понятие гарантированного по выигрышам и рискам дележа. Приводятся достаточные условия существования указанных дележей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Guaranty payoff sharing and guaranty risk sharing in cooperative game

The formalization of guaranteed division by result and risk in the cooperative game when some uncertainty was realised and without the incidental payments, moreover there are supposed only scope of changes are known about the uncertainty, but any static characteristics are undefined.

Текст научной работы на тему «Гарантированные по выигрышам и рискам дележи в кооперативной игре»

УДК 519.833.7

© А.В. Аввакумов dewsha8 l@mail.ru

ГАРАНТИРОВАННЫЕ ПО ВЫИГРЫШАМ И РИСКАМ ДЕЛЕЖИ В КООПЕРАТИВНОЙ ИГРЕ 1

Ключевые слова: кооперативная игра без побочных платежей, риск, гарантированный делёж, неопределённость

Abstract. The formalization of guaranteed division by result and risk in the cooperative game when some uncertainty was realised and without the incidental payments, moreover there are supposed only scope of changes are known about the uncertainty, but any static characteristics are undefined.

1. Постановка задачи

Рассматрим кооперативную игру двух лиц без побочных платежей и при неопределенности

<{1,2}, {Xi}i=1>2, Y, fx, y) }i=1)2>. (1.1)

В игре (1.1) участвуют два игрока: первый и второй; каждый из них выбирает свою стратегию xi € Xi С Rni (i = 1,2), в результате образуется ситуация

x = (xi,X2) € X = X х X С Rn {п = п\+ щ)\

независимо от их выбора в игре реализуется неопределённость y € Y С Rm; па образовавшихся таким образом парах (x,y) € X х Y определена функция выигрыша i -го игрока

1 Работа поддержана грантом РФФИ

/¿(ж, у) (* = 1, 2) , значение которой на конкретной паре (ж, у) называется выигрышем г-го игрока в ситуации х € X и при неопределенности у € У .

Введём (согласно требованиям экономистов) функции риска. Учитывая ^кооперативный характер© игры (1.1), рассмотрим двухкритериальную задачу (для каждой неопределённости У € У):

(X, /ж,у)}г=1,2) , (1.2)

У€У

Ситуация ж*(у) € X Уу € У называется максимальной по Слейтеру (слабо эффективной) в задаче (1.2), если при любых ж € X и для каждого у € У несовместна система неравенств

/¿(ж,у) > /¿(ж*(у),у) (г = 1,2). (1.3)

.

1) множества Xi (г = 1,2) — выпуклые компакты, а У есть компакт;

2) функции выигрыша /¿(ж, у) (г = 1,2) строго вогнуты по ж € X при каждом у € У и непрерывны на X х У,

то многозначное отображение X5 [у : У ^ X , определяемое не.,

селектор ж*(у) € X5[у] Уу € У.

Замечание 1.1. Можно указать и другие достаточные условия существования непрерывного селектора ж*(у) . Далее, не оговаривая особо, считаем, что используемая вектор-функция ж*( у) имеет непрерывные компоненты на У.

Функцию риска ФДж, у) для критерия /¿(ж, у) введём (следуя идее принципа минимаксного сожаления Сэвиджа [1]) в виде

Фг(Х,у) = /*(ж*(у),у) - /¿(ж, у) (г = 1,2). (1.4)

Функция Фг(ж, у) численно оценивает риск (сожаление) г-го

у€У

партнёром) выбрал свою стратегию из ситуации ж , а не из ж*(у), хотя последняя и доставляет векторный максимум в задаче (1.2).

.

рыша /¿(ж, у) непрерывны на X х У и ж*(у) непрерывны на У, то функции риска ФДж, у), определённые в (1.4), непрерывны.

В ряде статей по экономике требуется, чтобы игроки ориентировались на возможно большие выигрыши и одновременно на возможно меньшие риски. Учитывая это, игре (1.1) поставим в соответствие вспомогательную кооперативную игру при неопре-делённости

({1,2 }, {Xi }г=1)2, У, Ш Х, у), -Ф Д Х, у) } 1=1,2 ) . (1.5)

В (1.5) множества Xi, У и функции /¿(ж, у) те же, что в

г

ка в игре (1.5) стала векторной (/¿(ж, у), —ФДж, у)) , причем вторая компонента —ФДж, у) специально взята со знаком г'минусб.

г

Хi € Xi стремится к возможно большим значениям одновременно обеих компонент /¿(Х,у) и —Ф^ж, у) своей функции выигрыша Шж, у), —ФАж, у)) (г = 1,2) . При этом,

во-первых, игроки вынуждены учитывать возможность реализа-

у€У

У

во-вторых, игрокам разрешены любые переговоры о выборе совместной ситуации ж € X;

в-третьих, запрещено ^правилами пгрыб уступать часть своего выигрыша партнёру (в этом и есть смысл г'игры без побочных платежейб).

2. Формализация гарантированных дележей

Для каждой функции выигрыша /¿(x, у) (¿ = 1,2) и при каждой неопределенности у € Y введём максимины

/1 [У = ma£ min /i(xbx2,y),

xах £2ах /9 1 \

/20[у] = та? min /2(xbx2,y). ^

^ах x ах

, . .

(1.1) множества Xi (i = 1,2), Y суть компакты, а /¿(x,y)

(г = 1,2) непрерывны на X х Y, то функции /f [У (i = 1,2) ш

. Y.

Далее фиксируем некоторую неопределённость у = yd € Y и введём множество ситуаций ж € X, удовлетворяющих условию индивидуальной рациональности для функций выигрыша /i(ж, у) (i = 1,2) :

X(yd) = {ж € X/x,yd) ^ /[у^ (i = 1,2)} • (2.2)

Лемма 2.1. Имеет место

—Ф°[yd] = max min [—Ф1 (xi,x2,yd)] = /i[yd] — C[yd],

x аХч ах2 ('9Ч'\

—Ф2 Н = ma? min [—ф2 (x,x,y^ = /2[yd] — C2[yd],

x ах x ах где Ci[yd] = /i(x*(yd),yd)(i = 1,2).

В самом деле, из (1.4) получаем

—Ф1 (xbx2,yd)

max mm

x ах x ах2

= max mm

x ах x ах-2

—h(x*(yd),yd) + /i(xbx2,yd)

= — C[y ] + max min /i(xi,x2,y )• x ах x ах

Утверждение 2.2. Если ситуация ж € ^у^) (множество ^у^) определено в (2.2)), то

—#1 (ж,у^) ^ тет тт Г—Фх(ж1,Х2,у^)1

х еХ х2 еХ2

—Ф2(ж,у^) ^ тет тт Г—Ф2(х,Х,у^)1 х2 еХ х еХ

(2.4)

и обратмо.

Доказательство. Утверждение следует из (1.4),

(2.3) и цепочки эквиваленций

ж € ^у^ ^ ж € X/ж,у**) ^ /Р[у<*] (г = 1,2) ^

^ ж € X/x, /) — с[у*] ^ /РН — аН (г = ^ 2) ^

ж € X|—Фр(ж,уй) ^ —ФР[у*] (г = 1,2)

.

множества X те ситуации ж, которые удовлетворяют условию индивидуальной рациональности для г'минусб функций риска. Фактически утверждение 2.2 показало, что множество ситуаций, которые удовлетворяют условию индивидуальной рациональности как для функций выигрыша в игре (1.1), так и для г'минусб функций риска, совпадают между собой (вследствие специального вида функций риска (1.4)). Этот факт будет использован в следующем определении.

.

(без побочных платежей и при неопределенности) ситуация ж5 € X реализует гарантированный по выигрышам и рискам делёж (/^, /^, Ф5, ф|), если существует неопределённость уз € У, для которой /р5 = /р(ж5, уз), Ф5 = Фр(ж5, уз) (¿ = 1,2) и

1) неопределённость уз € У является минимальной по Слейтеру в четырёхкритериальной задаче

(У, Шж5, у), —Фр(ж5, у)}р=1)2> , (2.5)

.

ж = ж5 , (т.е. при любых у € У несовместна система неравенств /р(ж5, у) < /3, Фр(ж5, у) > Ф5 (г = 1, 2)); (2.6)

2) ситуация ж5 € X является максимальной по Слейтеру в задаче

, ЩХ, уз), —фр(Х, уз)}р=1)2), (2.7)

.

сти у = уз и заменой X на ^у^) ; гДе ^уз) удовлетворя-

.

выигрыша /р(ж, у) (г = 1,2) в игре (1.1) при у^ = уз (т.е. при любых ж € ^уй') несовместна система неравенств

/р(ж,уз) > /3, Фр(ж,уз) < Ф5 (г = 1,2)). (2.8)

При этом /3 = (/3, /3) назовём гарантированным векторным выигрышем, Ф3 = (Ф3, Ф3) — гарантированным векторным риском, ^3 = (/3, /3, Ф3, Ф3) — гарантированным по выигрышам и рискам дележом игры (1.1), а тройку (ж3, /3, Ф3) € X х Я4 — гарантированным по исходам и рискам решением кооперативной игры (1.1).

Замечание 2.2. а) предложенное здесь определение является аналогом седловой точки (ж3, уз) € X х У скалярной функции ^(ж,у), которая определяется цепочкой равенств

тт^(ж3, у) = ^(ж3, уз) = тах^(ж,у3). (2.9)

уеУ хеХ

В самом деле, левое равенство в требовании 1) из определения

2.1 заменено на векторный минимум (по Слейтеру), а правое в 2) заменено на векторный максимум (также по Слейтеру). В определении можно было бы использовать и другие векторные опти-мумы (по Парето, по Борвейну, по Джоффриону и А-оптимумы);

b) из требования 1) определения 2.1 получаем г'гарантирую-щий смыслС предлагаемого понятия. Он состоит в том, что из несовместности системы (2.6) следует: при реализации в игре

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

у€У

тегий из ситуации ж3 соответствующие выигрыши /р(ж3, у) не могут стать меньше /3 и одновременно соответствующие риски Фр(ж3,у) —больше Ф3 , то есть гарантированный векторный выигрыш /3 ограничивает снизу векторный выигрыш /ж3, у) для всех у € У , а гарантированный векторный риск Ф3 ограничивает сверху векторный риск Ф(ж3, у) при тех же неопределенностях у € У

c) для построения гарантированного по выигрышам и рискам дележа достаточно построить пару (ж3, уз) € X х У, удовлетворяющую требованиям определения 2.1, а затем с помощью (ж3,уз) уже найти /3 = /р(ж3,уз), Ф3 = Фр(ж3,уз) (г = 1,2). Эту пару (ж3, уз) будем дальше называть седловой тонкой по Слейтеру для игры (1.5).

3. Достаточные условия

Введём функции

Ях(ж,у,а) = Е / ж, у) — (1 — ар) /р( ж*( у),у)],

Р=12 (3-1)

н(Х,у,в) = — Ё[£(х,у) — (! — &)ЖХ*(уКуЖ

р=1

где ж*(у) — непрерывная на У вектор-функция, являющаяся максимальным по Слейтеру решением задачи (1.2) при любом у € У; постоянные ар в € [0, 1] (¿ = 1,2).

Утверждение 3.1. (Достаточные условия существования седловой точки (ж3, уз). ) Пусть существуют кон-

станты аг,вг € [0,1] (i = 1,2) и пара (ж3,ys) такие, что

max H(x,ys= ,ys, а,

xeX(ys) /3 2)

max H(xS ,у,в) = Я2(ж3 ,ys ,в)-yeY

Тогда пара (ж3,ys) является седловой точкой no Слейтеру для игры, (1.5); здесь множество ситуаций Х(уз) (удовлетворяющих условию индивидуальной рациональности) определено в .,..

Доказательство. Согласно работе [3, с.71] ситуация ж3 € Х(уз) будет максимальной по Слейтеру в четырёхкритериальной задаче (2.5), если существуют постоянные аг € [0,1] (¿ = 1,2) такие, что

max [а/ж, уз) + af(x,y^ - (1 - ai)#i(x,ys) -

x€X(ys)

—(1 — a2)#2(x, уз)] = Idem [ж ^ ж3].

Подставляя сюда явный вид функций риска Фр(ж, у) (¿ = 1,2) из

(1.4), получим, с учётом обозначений (3.1), первое равенство из

(3.2). Справедливость второго равенства из (3.2) устанавливается аналогично.

Замечание 3.1. Введём вспомогательную бескоалиционную игру двух лиц

<{1,11}, {X, Y }, {Н(ж, у, а, Н(ж, у, в » . (3-3)

В игре (3.3) игрок I за счёт выбора своей стратегии ж € X (ситуации для игры (1.1)) стремится к возможно большему выигрышу (значению своей функции выигрыша Н(ж,у,а) ) при дополнительном ограничении ж € Х(уз) (где Х(уз) множество ситуаций ж € X игры (1.1), удовлетворяющих условию индивидуальной рациональности (2.2) для функций выигрыша в игре (1.1) при yd = yS). Игрок II за счёт выбора своей стратегии у € Y

(неопределенности в игре (1.1)) стремится к возможно большему значению своей функции выигрыша Н2(ж, у, в) • Тогда равенства

(3.2) определяют ситуацию равновесия по Нэшу (ж3, уз) в бескоалиционной игре двух лиц (3.3) при дополнительном ограничении ж € ^у^) ■ Заметим, что в (3.3) постоянные ,вР € [0,1] и функции выигрыша Нр(•) (г = 1,2) определены в (3.1).

Описанный факт сведения задачи построения пары (ж3, уз) к нахождению ситуации равновесия по Нэшу в игре (3.3) при ограничении ж € ^уз) может быть использован, во-первых, при выявлении достаточных условий ( в виде ограничений на элементы игры (1.1)), при которых существует гарантированный по выигрышам и рискам делёж; во-вторых, при построении явного вида гарантированного решения для частных видов игры (1.1).

Дальше будет рассмотрен частый вид игры (1.1), для которой будет предложен конструктивный способ построения гарантированного дележа.

4. Игра с разделёнными 6 функциями выигрыша

Рассмотрим игру (1.1), где функции выигрыша игроков имеют вид

/р(ж, у) = фр(ж) + Шр(у) (г = 1,2), (4.1)

то есть рассматриваем кооперативную игру двух лиц при неопре-делённости и без побочных платежей

<{1,2}, (X}р=1)2, У, (Фр(ж) + у)}р=1)2>. (4.2)

В игре (4.2) множество Xi стратегий Хр у г-го игрока и множе-Уу том, что функции выигрыша /р(ж, у) г'разделеныб по ситуациям и неопределённостям, именно, имеют вид (4.1). Для игры (4.2) будем предполагать, не оговаривая специально, что выполнено

Условие 4.1. Множества Xi (г = 1,2) и У суть непустые компакты, а скалярные функции Фр(ж) (шр(у)) (г = 1,2) непрерывны па X = X х X (соответственно на У).

Будем также использовать двухкомпонентные векторы

Ф = (Фг, Ф2), ш = (ш!,ш2)-

у € У

функция риска для функции выигрыша Фр(ж) + шР(у) имеет, вид Фр(ж, у) = Фр(ж*) — Фр(ж) (* = !, 2), (4-3)

где ж* € X3 — множество максимальных по Слейтеру альтер-ж*

(ХФ(ж)> . (4.4)

Доказательство. Задача (1.2), с учётом (4.1), примет вид

(X, Щж, у) = Фр(ж) + шр(у)}р=1>2>, (4.5)

ж* у у€У

неравенств

фр(ж) + шр(у) > Фр(ж*(у)) + шр(у Уж € X (г = 1, 2), что эквивалентно несовместности

Фр(ж) >Фр(Х*(у)) Уж € X(г = l,2).

ж* у у

ж*

двухкритериальной задаче (4.4) (множество их в лемме 4.1 обозначено символом X3 ). Исходя из (1.4), функция риска примет вид (4.3).

Замечание 4.1. Так как по условию 4.1 множество X является компактом в Л”, а Фр(ж) (г = 1,2) непрерывны,

то из работы [3, с. 142] следует, что множество X3 есть непустой компакт. В качестве ж* можно взять любую точку их X3 , но она должна быть одной и той же для обеих функций риска Фр(ж, у) (г = 1,2) .

Перейдём к построению множества (2.2). Введём обозначения для максиминов Ф° (г = 1,2) и максиминных стратегий хР

г,

фО

= max min min Wi(X,x),

X €Xi X X GX‘2

ФЙ = max min Ф2(х1, x2) = min Ф2(х!,хй). x2 eXx €Xi X eXi

Заметим, что из (4.6) получаем

(4.6)

Ф? < Фх (ж?,ж2) Уж2 € X, /47ч

Ф^Ф2(хьх§) Ух € X.

Кроме того, согласно работе [2, с. 109] при выполнении условий

4.1 указанные в (4.4) максимины Фр и максиминные стратегии х° (¿ = 1,2) существуют.

у € У

..

X(y) = X = {ж € X|ФДж) ^ ФР (г = 1, 2)} , (4.8)

при этом множество X является непустым компактом.

Доказательство. Множество (2.2) для игры

(4.2) преобразуется следующим образом:

^у^ {ж € X|Фр(ж) + шр(у*) ^ ФР + шр(у*) (¿ = 1,2)} =

= {ж € X|Фр(Х ^ Фр (г = 1, 2)} = X С X.

Множество X не пусто, так как ситуация из максиминных стратегий ж0 = (ж®, ж®) в (4-6) удовлетворяет неравенствам (в силу (4.7))

Фр(ж0) ^Фрр (г = 1,2),

и, следовательно, ж0 € X. Наконец, множество X замкнуто, согласно нестрогим неравенствам в (4.8). Так как X С X а X ограничено (что следует из компактности X = X х X2 ), то и X ограничено. Из ограниченности, замкнутости и непустоты X получаем, что множество X из (4.8) есть непустой компакт.

.,

то в игре (4.2) для всех у € У существует ситуация ж3 € X, реализующая гарантированный по выигрышам и рискам делёж

(Ф(ж3) + ш(у), Ф(ж*) - Ф(ж3)) ;

здесь ж3 — максимальная по Слейтеру ситуация в двухкритериальной задаче (X, Ф(ж)) , множество X определено в (4.6), . , ж* задаче (X, Ф(ж)>.

Доказательство. Для игры (4.2) множество ^(у^^ = X (лемма 4.2). Тогда, согласно требованию 1) определения 2.1, виду /р(ж, у) из (4.1) и Фр(ж, у) го (4.3), при всех у € У несовместна система из четырёх неравенств

Фр(ж3) + шр(у)<Фр(ж3) + шр(уз), , .

Фр(ж*) - Фр(ж3) > Фр(ж*) - Фр(ж3) (г = 1,2). { 1

Но вторая подсистема обращается в равенства, и поэтому система (4.9) несовместна при любых у € У (в качестве у3 можно

у€У

Требование 2) определения 2.1 для игры (4.2) сводится к несовместности (при любых ж € X) системы из четырёх неравенств

Фр(ж) + шр(уз) > Фр(Х3) + шр(уз),

Щж*) - Фр(ж) < Фр(ж*) - Фр(ж3) (г = 1,2),

что эквивалентно несовместности при любых x € X системы из двух неравенств

Щx)>Wi(xS) (i = l,2). (4.10)

В свою очередь, несовместность системы (4.10) при всех x € X означает, что xS есть максимальная по Слейтеру ситуация в

X, x

X (лемма 4.2), непрерывности компонент ФР(x) вектора Ф(^) = (Ф]. (x), Ф2 (x)) и из работы [3, с. 142] следует, что такая ситуация xS € X существует.

Замечание 4.2. Из утверждения 4.1 получаем следующий способ построения гарантированного по выигрышам и рискам решения игры (4.2):

a) найти максимальную по Слейтеру ситуацию x* в двухкритериальной задаче (X, {Ф¿(x)}i=i,2);

b) найти максимины

Ф? = max min Фг(^,^),

X еХч еХ2

Ф° = x , x

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ж2 еХ2 X eXi

c) построить множество

X= {x € X|Ф^x) > Ф° (i = 1,2)} ,

это множество определяется пересечением

w(X) = w(X)p| {я| + ф 0},

где Ф(М) = и ф(x),R| = {Ф = (ФьФг)|Фi >0 (i = l,2)},Т0-

жеМ ^

гда Я > + Ф° есть сдвиг первой четверти координатной плоскости Я2 в точку Ф° = (Ф°, Ф2);

d) найти максимальную по Слейтеру ситуацию xS в двухкритериальной задаче (X, {ФДx) ^=1,2) ; Для этого достаточно при каком-либо числе а € [0,1] решить оптимизационную задачу

max[^i(x) + (1 — а)Ф2 (x)] = аФ^5) + (1 — a^2(xS),

жеХ

заметим, что такой же приём (может быть, с другим числом в € [0,1] ) можно применить при построении ж* в а);

е) выписать явный вид гарантированного по выигрышам и рискам решения игры (4.2) по формуле

(ж3, Ф(ж3) + w(y), Ф(ж*) - Ф(ж3)) Vy € Y.

Заметим, что вообще говоря, во-первых, ж* ф ж3, во-вторых, как ж*, так и ж3 определяются неоднозначно вследствие множественности максимальных по Слейтеру альтернатив в многокритериальных задачах (в предложенном здесь алгоритме можно использовать любые).

Автор благодарит В.И. Жуковского за постановку задачи и обсуждение работы.

Список литературы

1. Sawadge L.Y. The theory of statistical decision

//J, American Statistical Association. 1951. Г" 46. P. 55-67.

2. Жуковский В.И. Кооперативные игры при неопределенности и их приложения. М.: Э. упорна, i УРСС, 1999.

3. Подиновский В.В., Ногин В.Д. Парето-оптимальные решения многокритериальных задач. М.: Наука, 1982.

i Надоели баннеры? Вы всегда можете отключить рекламу.